Een kort pleidooi voor het inrichten van een Nederlandstalige versie van de DBpedia om zo de collecties van Bibliotheken, Archieven en Musea beter vindbaar te maken en eenvoudiger te kunnen koppelen met andere relevante informatiebronnen. In het kader van het Open Zoekplatform wil Stichting Bibliotheek.nl een eerste aanzet doen voor het inrichten van het NL-domein. Het wordt echter alleen een succes wanneer enthousiaste personen en organisaties hun schouders hieronder willen zetten. Er is werk aan de winkel voor programmeurs, dataspecialisten en Wikipedianen. Stuur een mailtje als je ons wil helpen!!
2. Wikipedia artikelen per land (mln)
bron: http://stats.wikimedia.org/EN/Sitemap.htm#comparisons
3,89
1,36
1,21
1,02
en de fr nl
% templates gemapped in DBpedia
http://mappings.dbpedia.org/sprint/
81,61
54,82
38,73
1,5
en de fr nl
3.
4. dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@en
Tekst tot inhoudsopgave
(max. 500 woorden)
dbpedia:Herman_Brusselmans dbpedia-owl:abstract "Herman Frans
Martha Brusselmans is a Flemish novelist... Koen Mortier."@en
5. Maar:
- versie 3.7; stand juli 2011!
- alleen Engelse versie wordt direct bijgewerkt (Live extraction)
- beperkt aantal talen (waaronder nl)
dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@nl
dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@fr
dbpedia:Herman_Brusselmans rdfs:label "Herman Brusselmans"@de
dbpedia:Herman_Brusselmans dbpedia-owl:abstract “Herman Frans
Martha Brusselmans is een Vlaams schrijver."@nl
dbpedia:Herman_Brusselmans dbpedia-owl:abstract "Herman Frans
Martha ... monde des lettres."@fr
dbpedia:Herman_Brusselmans dbpedia-owl:abstract "Herman
Brusselmans … lebt in Gent."@de
6. En verder nog meer algemene mapping’s:
• Images. Links pointing at Wikimedia Commons images depicting a resource are extracted and represented
by using the foaf:depiction property.
• Redirects. In order to identify synonymous terms, Wikipedia articles can redirect to other articles. We
extract these redirects and use them to resolve references between DBpedia resources.
• External links. Articles contain references to external Web resources which we represent by using the
DBpedia property dbpedia:reference.
• Pagelinks. We extract all links between Wikipedia articles and represent them by using the
dbpedia:wikilink property.
• Homepages. This extractor obtains links to the homepages of entities such as companies and organisations
by looking for the terms homepage or website within article links
• Categories. Wikipedia articles are arranged in categories, which we represent by using the SKOS
vocabulary4.
• Geo-coordinates. The geo-extractor expresses coordinates by using the Basic Geo (WGS84 lat/long)
Vocabulary5 and the GeoRSS Simple encoding of the W3C Geospatial Vocabulary6.
• Metainformation. A new extractor which introduces organisational properties like direct edit links and oai
identifiers for edit and delete operations.
7. foaf:name
dbpprop:background
{{Infobox musical artist
| name = Tom Waits foaf:givenName
| image = Tom Waits 3.jpg
| caption = Waits … in Buenos Aires, Argentina, April 2007
| background = solo_singer dbpedia-owl:birthDate
| birth_name = Thomas Alan Waits
| birth_date = {{Birth date and age|mf=yes|1949|12|7}}
| birth_place =[[Pomona, California]], United States
| instrument = [[Singing|Vocals]], [[piano]], [[guitar]]
dbpedia-owl:birthPlace
| genre = [[Rock music|Rock]], [[experimental music]]
| occupation = Singer-songwriter, musician, actor, composer
| years_active = 1972–present dbpprop:instrument
| label = [[Asylum Records]], [[Island Records]], [[ANTI-]]
| website = {{URL|http://www.badasme.com/|Official website}}
}}
dbpprop:genre
dbpprop:occupation
dbpedia-owl:activeYearsStartYear
dbpedia-owl:recordLabel
foaf:homepage
12. • Invulling info boxen is beperkt
• Specifieke taal problemen zie aanpassing voor Griekse chapter
(o.a. ook IRI’s)
13.
14. meer informatie
• mappings.dbpedia.org
• artikel: “DBpedia Live Extraction”, Sebastian Hellman
e.a., 2009
• artikel: “Internationalization of Linked Data: The case of
the Greek DBpedia edition”, Dimitris Kontokostas, 2012
• DBpedia Mapping Language, Anja Jentzsch, 2010
• dbpedia-discussion@lists.sourceforge.net
15. Voorstel
1. nl.dbpedia.org en Extraction Framework inrichten
door DBpedia team Leipzig ism Bibliotheek.nl
2. configuren/aanpassen software voor betere (taalgevoelige) harvesting
door Bibliotheek.nl / DBpedia team / programmeurs ism UvA? Univ Gent???
3. invullen mappingsschema’s en uitbreiden ontologie en properties
door IT/IP’ers via community ism Bibliotheek.nl / Bibnet (?)
4. beter invullen van de Infobox op de wikipedia pagina
door community met ondersteuning van bibliotheekorganisaties en WikiMedia
16. discussie
• Goed idee?
• Gaat het werken via de community? Hoe moeten we dit opstarten?
• Welke organisaties kennen jullie die hier een rol bij zouden willen spelen?
• Meer richten op software voor vullen van Infobox (tekst analyse, zie
bijvoorbeeld Ipopulator)
• Wat te doen met dialecten bijv. Fries?
• Zouden we ons niet moeten concentreren op specifieke informatie?
• WIE DOET MEE?