Presentation delivered by Christophe Guéret at Linked Open Data @ AIMS Webinars.
http://aims.fao.org/linked-open-data-webinars-at-aims
http://aims.fao.org/linked-open-data-webinars-at-aims/christophe-guedet
Webinar@AIMS: How to practically support Open Access: Guidelines for Data Pro...
Clarifier le sens de vos données publiques avec le Web de données
1. Data Archiving and Networked Services
Clarifier le sens de vos
données publiques avec
le Web de données
Christophe Guéret (@cgueret)
Webinar LOD@AIMS, January 22, 2013
DANS is een instituut van KNAW en NWO
2. Le Web de données
● Publier des données sur le Web
● Publication selon des principes simples:
○ Décrire des ressources identifiées par des URI
(addresses Web)
○ Connecter les ressources avec des liens typés
● Quel est l'avantage? Pourquoi publier les
données de cette façon?
3. Prenons un exemple...
● Implantation d'un projet immobilier dans la
commune de "Vouvray" (Indre et Loire, France)
● Des informations sont nécessaires sur
○ Les conditions météo de la zone
○ L'utilisation faite des sols dans les environs
○ La faune et la flore locale
○ Les données liées à la propriété
○ ...
4. La recherche de données
● De nombreuses données gouvernementales
sont qualifiées d' "Open Data" et par
conséquent libres d'accès
● Processus d'intégration de données
○ Chercher des sources de données
○ Acquérir et intégrer les données
○ Publier un document de synthèse
5. Les données (fictives) récupérées
Area City Land use
Indre et Loire Vouvray Vineyard
Parcelle Feuille Superficie
1388 000G02 1664 m2
Ville Ensoleillement
Vouvray 3000h / an
6. L'intégration s'avère difficile...
Area City Land use
Indre et Loire Vouvray Vineyard
Parcelle Feuille Superficie Ville Zone ?
1388 000G02 1664 m2
+ Vouvray ? ?
Ville Ensoleillement
Vouvray 3000h / an
● Problèmes
○ Langue : "Area" = "Département" ?
○ Terminologie : "Parcelle", "Feuille" ?
○ Ambiguïté : "Vouvray" = "Vouvray" ?
7. Quel est le problème exactement?
● Toutes les sources de données publient des
données ouvertes et facilement utilisables
● Mais...
○ La signification (sémantique) des données n'est pas
claire
○ Des noms ambigus sont utilisés
● Besoin de clarifier les concepts utilisés et les
entités auxquelles il est fait référence
8. Une solution : uniformiser
● Créer un système d'information uniforme
○ Les sources d'information saisissent leurs données
○ Les concepts employés sont identiques
○ Les entités référencées sont contrôlées
● De nombreux exemples
...
● Solution dédiée et générique
9. Une autre solution : le Web
● Le Web de données (WoD) permet la
publication décentralisée de données
● Chaque jeu de données publié utilise
○ Un modèle basé sur des relations entre ressources
○ Des identifiants uniques à la place des mots
○ Un vocabulaire commun pour exprimer les relations
● Les identifiants des ressources sont des URI
10. Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
http://dbpedia.org/resource/Vouvray
http://dbpedia.org/ontology/department
http://dbpedia.org/resource/Indre-et-Loire
● Description associée à une ressource
http://dbpedia.org/resource/Vouvray
http://xmlns.com/foaf/0.1/name
Vouvray
11. Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
dbpedia-owl:department
dbpedia:Vouvray dbpedia:Indre-et-Loire
● Description associée à une ressource
foaf:name
dbpedia:Vouvray Vouvray
12. Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
dbpedia-owl:department
dbpedia:Vouvray dbpedia:Indre-et-Loire
predicat
sujet objet
● Description associée à une ressource
foaf:name
dbpedia:Vouvray Vouvray
13. Triplets connectés = WoD
Le Web de documents Le Web de données
r1 r4
p1 p1
r2 p3
p2
r3
17. Revenons à notre exemple...
● Le travail du consommateur est simplifié
○ Les différent jeux de données sont interconnectés
○ Parcourir le WoD en partant du noeud "Vouvray" permet
de trouver les informations nécessaires
○ Nul besoin de télécharger des jeux de données entiers !
■ Approche remplacée par des requêtes ciblées
● Les données publiées sont enrichies
○ Chaque contributeur apporte ses informations
22. Participez!
● Publiez vos données sur le Web et
connectez-les aux autres ressources
● En quelque étapes
○ Identifiez les ressources décrites par vos données
(Villes, Personnes, Lieux, ...)
○ Assignez des URI aux ressources décrites
○ Choisissez des vocabulaires (DC, FOAF, Agrovoc,
...)
○ Décrivez vos ressources en RDF