SlideShare uma empresa Scribd logo
1 de 22
Baixar para ler offline
Data Archiving and Networked Services



 Clarifier le sens de vos
données publiques avec
   le Web de données
          Christophe Guéret (@cgueret)

 Webinar LOD@AIMS, January 22, 2013



DANS is een instituut van KNAW en NWO
Le Web de données
● Publier des données sur le Web

● Publication selon des principes simples:
  ○ Décrire des ressources identifiées par des URI
    (addresses Web)
  ○ Connecter les ressources avec des liens typés


● Quel est l'avantage? Pourquoi publier les
  données de cette façon?
Prenons un exemple...
● Implantation d'un projet immobilier dans la
  commune de "Vouvray" (Indre et Loire, France)

● Des informations sont nécessaires sur
  ○   Les conditions météo de la zone
  ○   L'utilisation faite des sols dans les environs
  ○   La faune et la flore locale
  ○   Les données liées à la propriété
  ○   ...
La recherche de données
● De nombreuses données gouvernementales
  sont qualifiées d' "Open Data" et par
  conséquent libres d'accès

● Processus d'intégration de données
  ○ Chercher des sources de données
  ○ Acquérir et intégrer les données
  ○ Publier un document de synthèse
Les données (fictives) récupérées

                        Area                 City            Land use

                 Indre et Loire     Vouvray                Vineyard




                   Parcelle           Feuille               Superficie

                 1388             000G02                 1664 m2




                         Ville                      Ensoleillement

                 Vouvray                   3000h / an
L'intégration s'avère difficile...
    Area             City     Land use

Indre et Loire     Vouvray    Vineyard

Parcelle         Feuille     Superficie          Ville   Zone       ?

1388         000G02         1664 m2
                                          +   Vouvray    ?      ?

  Ville            Ensoleillement

Vouvray    3000h / an




● Problèmes
       ○ Langue : "Area" = "Département" ?
       ○ Terminologie : "Parcelle", "Feuille" ?
       ○ Ambiguïté : "Vouvray" = "Vouvray" ?
Quel est le problème exactement?

● Toutes les sources de données publient des
  données ouvertes et facilement utilisables

● Mais...
   ○ La signification (sémantique) des données n'est pas
     claire
   ○ Des noms ambigus sont utilisés


● Besoin de clarifier les concepts utilisés et les
  entités auxquelles il est fait référence
Une solution : uniformiser
● Créer un système d'information uniforme
  ○ Les sources d'information saisissent leurs données
  ○ Les concepts employés sont identiques
  ○ Les entités référencées sont contrôlées


● De nombreux exemples

                                               ...


● Solution dédiée et générique
Une autre solution : le Web
● Le Web de données (WoD) permet la
  publication décentralisée de données

● Chaque jeu de données publié utilise
  ○ Un modèle basé sur des relations entre ressources
  ○ Des identifiants uniques à la place des mots
  ○ Un vocabulaire commun pour exprimer les relations


● Les identifiants des ressources sont des URI
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
  http://dbpedia.org/resource/Vouvray

                          http://dbpedia.org/ontology/department

                             http://dbpedia.org/resource/Indre-et-Loire


● Description associée à une ressource
  http://dbpedia.org/resource/Vouvray
                                           http://xmlns.com/foaf/0.1/name

                                               Vouvray
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
                  dbpedia-owl:department
dbpedia:Vouvray                            dbpedia:Indre-et-Loire




● Description associée à une ressource
                            foaf:name
dbpedia:Vouvray                              Vouvray
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
                  dbpedia-owl:department
dbpedia:Vouvray                            dbpedia:Indre-et-Loire

                       predicat
          sujet                                   objet


● Description associée à une ressource
                            foaf:name
dbpedia:Vouvray                              Vouvray
Triplets connectés = WoD

Le Web de documents   Le Web de données


                        r1                       r4


                             p1             p1

                                  r2             p3

                                       p2


                                       r3
Chacun contribue au WoD

                                           dbpedia:Indre-et-Loire



                                           dbpedia-owl:department

                     dbpedia:Vouvray

    gn:nearby
                                           wgs84_pos:lat

 geonames:8292345
                          wgs84_pos:long      47.41088


                    0.79892
Données de DBpedia

                                           dbpedia:Indre-et-Loire



                                           dbpedia-owl:department

                     dbpedia:Vouvray

    gn:nearby
                                           wgs84_pos:lat

 geonames:8292345
                          wgs84_pos:long      47.41088


                    0.79892
Données de Geonames

                                           dbpedia:Indre-et-Loire



                                           dbpedia-owl:department

                     dbpedia:Vouvray

    gn:nearby
                                           wgs84_pos:lat

 geonames:8292345
                          wgs84_pos:long      47.41088


                    0.79892
Revenons à notre exemple...
● Le travail du consommateur est simplifié
  ○ Les différent jeux de données sont interconnectés
  ○ Parcourir le WoD en partant du noeud "Vouvray" permet
    de trouver les informations nécessaires
  ○ Nul besoin de télécharger des jeux de données entiers !
    ■ Approche remplacée par des requêtes ciblées


● Les données publiées sont enrichies
  ○ Chaque contributeur apporte ses informations
Quelques exemples d'utilisation
Dévelopement et e-Gouvernance
● Interconnection de différents jeux de données
  permettant d'obtenir une vue globale:
SemanticXO et WikiReg
● Au lieu d'envoyer les données vers un
  serveur central, chaque XO est son propre
  serveur
RadioMarché
● Partage d'information relative au prix des
  produits agricoles (avec Agrovoc)
Participez!
● Publiez vos données sur le Web et
  connectez-les aux autres ressources

● En quelque étapes
  ○ Identifiez les ressources décrites par vos données
    (Villes, Personnes, Lieux, ...)
  ○ Assignez des URI aux ressources décrites
  ○ Choisissez des vocabulaires (DC, FOAF, Agrovoc,
    ...)
  ○ Décrivez vos ressources en RDF

Mais conteúdo relacionado

Destaque

Manual bosch encimera de inducción pid631 b17e
Manual bosch   encimera de inducción pid631 b17eManual bosch   encimera de inducción pid631 b17e
Manual bosch encimera de inducción pid631 b17eAlsako Electrodomésticos
 
Cce pourquoi ça ne peut pas marcher
Cce pourquoi ça ne peut pas marcherCce pourquoi ça ne peut pas marcher
Cce pourquoi ça ne peut pas marcherOPLPV
 
Normatividad derechos de_autor
Normatividad derechos de_autorNormatividad derechos de_autor
Normatividad derechos de_autorchinitotefa
 
Historia del internet en el salvador2
Historia del internet en el salvador2Historia del internet en el salvador2
Historia del internet en el salvador2William Dominguez
 
ли ю.а. дисциплина фр.яз
ли ю.а. дисциплина   фр.язли ю.а. дисциплина   фр.яз
ли ю.а. дисциплина фр.язLi Julie
 
Funciones de las imágenes
Funciones de las imágenesFunciones de las imágenes
Funciones de las imágenesALBA_11
 
ServicesEnGares_GareduFutur SP [Compatibility Mode]
ServicesEnGares_GareduFutur SP [Compatibility Mode]ServicesEnGares_GareduFutur SP [Compatibility Mode]
ServicesEnGares_GareduFutur SP [Compatibility Mode]Svetlana POPOVA
 
Dn11 c éboola Maria Guadalupe INFORMATICA
Dn11 c éboola Maria Guadalupe INFORMATICADn11 c éboola Maria Guadalupe INFORMATICA
Dn11 c éboola Maria Guadalupe INFORMATICALupita Vargas Hdez
 
Redes sociales (Youtube)
Redes sociales (Youtube)Redes sociales (Youtube)
Redes sociales (Youtube)sebastianrico00
 

Destaque (20)

Manual bosch encimera de inducción pid631 b17e
Manual bosch   encimera de inducción pid631 b17eManual bosch   encimera de inducción pid631 b17e
Manual bosch encimera de inducción pid631 b17e
 
Cce pourquoi ça ne peut pas marcher
Cce pourquoi ça ne peut pas marcherCce pourquoi ça ne peut pas marcher
Cce pourquoi ça ne peut pas marcher
 
Nature en sursis
Nature en sursisNature en sursis
Nature en sursis
 
Normatividad derechos de_autor
Normatividad derechos de_autorNormatividad derechos de_autor
Normatividad derechos de_autor
 
Historia del internet en el salvador2
Historia del internet en el salvador2Historia del internet en el salvador2
Historia del internet en el salvador2
 
Cantero oscar powerpoint
Cantero oscar powerpointCantero oscar powerpoint
Cantero oscar powerpoint
 
Lecture1
Lecture1Lecture1
Lecture1
 
ли ю.а. дисциплина фр.яз
ли ю.а. дисциплина   фр.язли ю.а. дисциплина   фр.яз
ли ю.а. дисциплина фр.яз
 
Funciones de las imágenes
Funciones de las imágenesFunciones de las imágenes
Funciones de las imágenes
 
ServicesEnGares_GareduFutur SP [Compatibility Mode]
ServicesEnGares_GareduFutur SP [Compatibility Mode]ServicesEnGares_GareduFutur SP [Compatibility Mode]
ServicesEnGares_GareduFutur SP [Compatibility Mode]
 
Lenguaje
LenguajeLenguaje
Lenguaje
 
Procesador de texto
Procesador de textoProcesador de texto
Procesador de texto
 
Plfss 2014
Plfss 2014Plfss 2014
Plfss 2014
 
Manual bosch microondas hmt75 m654
Manual bosch   microondas hmt75 m654Manual bosch   microondas hmt75 m654
Manual bosch microondas hmt75 m654
 
Dn11 c éboola Maria Guadalupe INFORMATICA
Dn11 c éboola Maria Guadalupe INFORMATICADn11 c éboola Maria Guadalupe INFORMATICA
Dn11 c éboola Maria Guadalupe INFORMATICA
 
Reglamento institucional alexandra copia
Reglamento institucional alexandra   copiaReglamento institucional alexandra   copia
Reglamento institucional alexandra copia
 
Redes sociales (Youtube)
Redes sociales (Youtube)Redes sociales (Youtube)
Redes sociales (Youtube)
 
Formation intelligence collective île de la réunion
Formation intelligence collective île de la réunionFormation intelligence collective île de la réunion
Formation intelligence collective île de la réunion
 
Precesión e historia
Precesión e historiaPrecesión e historia
Precesión e historia
 
Manual siemens campana lc77be532
Manual siemens   campana lc77be532Manual siemens   campana lc77be532
Manual siemens campana lc77be532
 

Mais de Christophe Guéret

HHAI June 2022 - KGs and Hybrid Intelligence
HHAI June 2022 - KGs and Hybrid IntelligenceHHAI June 2022 - KGs and Hybrid Intelligence
HHAI June 2022 - KGs and Hybrid IntelligenceChristophe Guéret
 
Informal presentation about RES
Informal presentation about RESInformal presentation about RES
Informal presentation about RESChristophe Guéret
 
Stop making tools! Nobody likes them anyway...
Stop making tools! Nobody likes them anyway...Stop making tools! Nobody likes them anyway...
Stop making tools! Nobody likes them anyway...Christophe Guéret
 
The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...
The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...
The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...Christophe Guéret
 
Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"
Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"
Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"Christophe Guéret
 
The Entity Registry System (ERS)
The Entity Registry System (ERS)The Entity Registry System (ERS)
The Entity Registry System (ERS)Christophe Guéret
 
Let's downscale the semantic web !
Let's downscale the semantic web !Let's downscale the semantic web !
Let's downscale the semantic web !Christophe Guéret
 
Your next data viz gear should be a Wii-U
Your next data viz gear should be a Wii-UYour next data viz gear should be a Wii-U
Your next data viz gear should be a Wii-UChristophe Guéret
 
The road towards a Web-based data ecosystem
The road towards a Web-based data ecosystemThe road towards a Web-based data ecosystem
The road towards a Web-based data ecosystemChristophe Guéret
 
Linked Open Data for Digital Humanities
Linked Open Data for Digital HumanitiesLinked Open Data for Digital Humanities
Linked Open Data for Digital HumanitiesChristophe Guéret
 
Downscaling information systems for education
Downscaling information systems for educationDownscaling information systems for education
Downscaling information systems for educationChristophe Guéret
 
ICT4D course 2013 - Low resources infrastructure
ICT4D course 2013 - Low resources infrastructureICT4D course 2013 - Low resources infrastructure
ICT4D course 2013 - Low resources infrastructureChristophe Guéret
 
ICT4D course 2013 - OLPC deployments
ICT4D course 2013 - OLPC deploymentsICT4D course 2013 - OLPC deployments
ICT4D course 2013 - OLPC deploymentsChristophe Guéret
 
Exposing the data from NARCIS with VIVO
Exposing the data from NARCIS with VIVOExposing the data from NARCIS with VIVO
Exposing the data from NARCIS with VIVOChristophe Guéret
 
Embedding young learners into the information society
Embedding young learners into the information societyEmbedding young learners into the information society
Embedding young learners into the information societyChristophe Guéret
 
Is linked data something for me?
Is linked data something for me?Is linked data something for me?
Is linked data something for me?Christophe Guéret
 

Mais de Christophe Guéret (20)

HHAI June 2022 - KGs and Hybrid Intelligence
HHAI June 2022 - KGs and Hybrid IntelligenceHHAI June 2022 - KGs and Hybrid Intelligence
HHAI June 2022 - KGs and Hybrid Intelligence
 
Informal presentation about RES
Informal presentation about RESInformal presentation about RES
Informal presentation about RES
 
Stop making tools! Nobody likes them anyway...
Stop making tools! Nobody likes them anyway...Stop making tools! Nobody likes them anyway...
Stop making tools! Nobody likes them anyway...
 
The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...
The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...
The Entity Registry System: Collaborative Editing of Entity Data in Poorly Co...
 
Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"
Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"
Introduction about WorldWideSemanticWeb.org for the workshop "Making it Matter"
 
The Entity Registry System (ERS)
The Entity Registry System (ERS)The Entity Registry System (ERS)
The Entity Registry System (ERS)
 
Let's downscale the semantic web !
Let's downscale the semantic web !Let's downscale the semantic web !
Let's downscale the semantic web !
 
Your next data viz gear should be a Wii-U
Your next data viz gear should be a Wii-UYour next data viz gear should be a Wii-U
Your next data viz gear should be a Wii-U
 
Linking knowledge spaces
Linking knowledge spacesLinking knowledge spaces
Linking knowledge spaces
 
The data behind the HuisKluis
The data behind the HuisKluisThe data behind the HuisKluis
The data behind the HuisKluis
 
Digital archiving 3.0
Digital archiving 3.0Digital archiving 3.0
Digital archiving 3.0
 
The road towards a Web-based data ecosystem
The road towards a Web-based data ecosystemThe road towards a Web-based data ecosystem
The road towards a Web-based data ecosystem
 
Linked Open Data for Digital Humanities
Linked Open Data for Digital HumanitiesLinked Open Data for Digital Humanities
Linked Open Data for Digital Humanities
 
Downscaling information systems for education
Downscaling information systems for educationDownscaling information systems for education
Downscaling information systems for education
 
ICT4D course 2013 - Low resources infrastructure
ICT4D course 2013 - Low resources infrastructureICT4D course 2013 - Low resources infrastructure
ICT4D course 2013 - Low resources infrastructure
 
ICT4D course 2013 - OLPC deployments
ICT4D course 2013 - OLPC deploymentsICT4D course 2013 - OLPC deployments
ICT4D course 2013 - OLPC deployments
 
ICT4D course 2013 - Sugar
ICT4D course 2013 - SugarICT4D course 2013 - Sugar
ICT4D course 2013 - Sugar
 
Exposing the data from NARCIS with VIVO
Exposing the data from NARCIS with VIVOExposing the data from NARCIS with VIVO
Exposing the data from NARCIS with VIVO
 
Embedding young learners into the information society
Embedding young learners into the information societyEmbedding young learners into the information society
Embedding young learners into the information society
 
Is linked data something for me?
Is linked data something for me?Is linked data something for me?
Is linked data something for me?
 

Clarifier le sens de vos données publiques avec le Web de données

  • 1. Data Archiving and Networked Services Clarifier le sens de vos données publiques avec le Web de données Christophe Guéret (@cgueret) Webinar LOD@AIMS, January 22, 2013 DANS is een instituut van KNAW en NWO
  • 2. Le Web de données ● Publier des données sur le Web ● Publication selon des principes simples: ○ Décrire des ressources identifiées par des URI (addresses Web) ○ Connecter les ressources avec des liens typés ● Quel est l'avantage? Pourquoi publier les données de cette façon?
  • 3. Prenons un exemple... ● Implantation d'un projet immobilier dans la commune de "Vouvray" (Indre et Loire, France) ● Des informations sont nécessaires sur ○ Les conditions météo de la zone ○ L'utilisation faite des sols dans les environs ○ La faune et la flore locale ○ Les données liées à la propriété ○ ...
  • 4. La recherche de données ● De nombreuses données gouvernementales sont qualifiées d' "Open Data" et par conséquent libres d'accès ● Processus d'intégration de données ○ Chercher des sources de données ○ Acquérir et intégrer les données ○ Publier un document de synthèse
  • 5. Les données (fictives) récupérées Area City Land use Indre et Loire Vouvray Vineyard Parcelle Feuille Superficie 1388 000G02 1664 m2 Ville Ensoleillement Vouvray 3000h / an
  • 6. L'intégration s'avère difficile... Area City Land use Indre et Loire Vouvray Vineyard Parcelle Feuille Superficie Ville Zone ? 1388 000G02 1664 m2 + Vouvray ? ? Ville Ensoleillement Vouvray 3000h / an ● Problèmes ○ Langue : "Area" = "Département" ? ○ Terminologie : "Parcelle", "Feuille" ? ○ Ambiguïté : "Vouvray" = "Vouvray" ?
  • 7. Quel est le problème exactement? ● Toutes les sources de données publient des données ouvertes et facilement utilisables ● Mais... ○ La signification (sémantique) des données n'est pas claire ○ Des noms ambigus sont utilisés ● Besoin de clarifier les concepts utilisés et les entités auxquelles il est fait référence
  • 8. Une solution : uniformiser ● Créer un système d'information uniforme ○ Les sources d'information saisissent leurs données ○ Les concepts employés sont identiques ○ Les entités référencées sont contrôlées ● De nombreux exemples ... ● Solution dédiée et générique
  • 9. Une autre solution : le Web ● Le Web de données (WoD) permet la publication décentralisée de données ● Chaque jeu de données publié utilise ○ Un modèle basé sur des relations entre ressources ○ Des identifiants uniques à la place des mots ○ Un vocabulaire commun pour exprimer les relations ● Les identifiants des ressources sont des URI
  • 10. Triplets RDF - la grammaire du WoD ● Connection entre deux ressources http://dbpedia.org/resource/Vouvray http://dbpedia.org/ontology/department http://dbpedia.org/resource/Indre-et-Loire ● Description associée à une ressource http://dbpedia.org/resource/Vouvray http://xmlns.com/foaf/0.1/name Vouvray
  • 11. Triplets RDF - la grammaire du WoD ● Connection entre deux ressources dbpedia-owl:department dbpedia:Vouvray dbpedia:Indre-et-Loire ● Description associée à une ressource foaf:name dbpedia:Vouvray Vouvray
  • 12. Triplets RDF - la grammaire du WoD ● Connection entre deux ressources dbpedia-owl:department dbpedia:Vouvray dbpedia:Indre-et-Loire predicat sujet objet ● Description associée à une ressource foaf:name dbpedia:Vouvray Vouvray
  • 13. Triplets connectés = WoD Le Web de documents Le Web de données r1 r4 p1 p1 r2 p3 p2 r3
  • 14. Chacun contribue au WoD dbpedia:Indre-et-Loire dbpedia-owl:department dbpedia:Vouvray gn:nearby wgs84_pos:lat geonames:8292345 wgs84_pos:long 47.41088 0.79892
  • 15. Données de DBpedia dbpedia:Indre-et-Loire dbpedia-owl:department dbpedia:Vouvray gn:nearby wgs84_pos:lat geonames:8292345 wgs84_pos:long 47.41088 0.79892
  • 16. Données de Geonames dbpedia:Indre-et-Loire dbpedia-owl:department dbpedia:Vouvray gn:nearby wgs84_pos:lat geonames:8292345 wgs84_pos:long 47.41088 0.79892
  • 17. Revenons à notre exemple... ● Le travail du consommateur est simplifié ○ Les différent jeux de données sont interconnectés ○ Parcourir le WoD en partant du noeud "Vouvray" permet de trouver les informations nécessaires ○ Nul besoin de télécharger des jeux de données entiers ! ■ Approche remplacée par des requêtes ciblées ● Les données publiées sont enrichies ○ Chaque contributeur apporte ses informations
  • 19. Dévelopement et e-Gouvernance ● Interconnection de différents jeux de données permettant d'obtenir une vue globale:
  • 20. SemanticXO et WikiReg ● Au lieu d'envoyer les données vers un serveur central, chaque XO est son propre serveur
  • 21. RadioMarché ● Partage d'information relative au prix des produits agricoles (avec Agrovoc)
  • 22. Participez! ● Publiez vos données sur le Web et connectez-les aux autres ressources ● En quelque étapes ○ Identifiez les ressources décrites par vos données (Villes, Personnes, Lieux, ...) ○ Assignez des URI aux ressources décrites ○ Choisissez des vocabulaires (DC, FOAF, Agrovoc, ...) ○ Décrivez vos ressources en RDF