O slideshow foi denunciado.
Utilizamos seu perfil e dados de atividades no LinkedIn para personalizar e exibir anúncios mais relevantes. Altere suas preferências de anúncios quando desejar.
Sudoc, Calames, theses.fret le Web de données<br />Atelier JABES2011<br />
Vers le Web de données<br />
Il faut participer au Web de données 			[Acquis]<br />
Objectifs de l’atelier<br />Faire un bilan d’étape<br />Montrer les données<br />Justifier certains choix<br />Expliquer c...
Partons du connu<br />
S’agit-il de données RDF ou d’une simple notice Dublin Core ?<br />
RDF nu<br />
about<br />En RDF, il faut expliciter de quoi on parle en l’identifiant par une URL : http://www.sudoc.fr/013041932/id<br ...
triplets<br />En RDF, tout est décomposé en triplets<br />Chaque triplet est indépendant<br />Chaque triplet pourrait être...
 Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/id
 Interopérabilité. Extensibilité. </li></li></ul><li>Identifier la langue avec le référentiel Lexvo<br />
Mettre en relation un document et une langue<br />La langue n’est pas un code (‘fre’)<br />La langue est une entité à part...
http://www.lexvo.org/id/iso639-3/fra décrite en HTML <br />
http://www.lexvo.org/id/iso639-3/fra décrite en RDF<br />
De fil en aiguille<br />La description de la langue poursuit la description du document Sudoc<br />Où s’arrêter ?<br />C’e...
Identifier les personnes avec IdRef<br />
IdRef, fournisseur d’identifiants et de référentiels<br />www.idref.fr = application Web ouverte<br />Ouverte sur le Web d...
IDREF Autorités Sudoc<br />Sudoc et IdRef<br />Sudoc<br />
Les autorités Sudoc,pivot du Linked data ABES<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours...
RDFa de Calames<br />Pas de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2...
http://www.calames.abes.fr/pub/ms/Calames-2010914119419211<br />RDFa de Calames<br />
RDFa de theses.fr<br />Pas encore de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802<...
Les thèsesportant sur les correspondants de Goethe<br />PREFIX foaf: <http://xmlns.com/foaf/0.1/><br />PREFIX dc: <http://...
Lier les données à IdRef, au-delà de l’ABES<br />
Linked data IST.fr ?<br />?<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours ( 2011)<br />Auto...
IdRef comme nœud régional<br />Positionnement d’IdRef : IST français<br />En complémentarité avec d’autres fournisseurs d’...
Autorités BnF<br />DBpedia<br />VIAF<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogiq. ?<br />HAL ...
Lier les données de l’IST entre elles, au-delà d’IdRef<br />
Linked data IST.fr ? Les labos !<br />?<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogique X<br />...
Linked data IST.fr ? Les affiliations<br />PRISMES (AMUE) locaux<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plate...
On parle de la même chose<br />owl:sameAs<br />
Identifier et nommer les personnes avec IdRef<br />
Identifier les concepts avec IdRef et RAMEAU<br />
IdRef et Rameau<br />Identifiants IdRef pour Rameau<br />A lier aux identifiants canoniques, ceux du centre national Ramea...
Préciser le rôle des agents avec les MARC Relators<br />
L’embarras du choix ?<br />dcterms:creator<br />dcterms:contributor<br />marcrel:aut<br />rda:authorWork<br />tef:auteur ?...
Qui utilise explicitementmarcrel:aut<br />		utilise implicitementdc:contributor<br />
Raisonnement<br />Le Sudoc dit :<br />http://www.sudoc.fr/012367206/id     marcrel:aut     http://www.idref.fr/ 026975262 ...
Qui utilise marcrel:aut<br />		peut également tef:auteur,<br />malgré la redondance apparente<br />
tef:auteur<br />Ne semble rien dire de plus que marcrel:aut<br />Mais possède une propriété intéressante :<br />C’est une ...
Raisonnement<br />Quelqu’un dit :<br />http://www.sudoc.fr/012367206/id     tef:auteur     http://www.idref.fr/035200898/i...
Démo<br />Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt<br />Outils de raisonnement ...
Raisonnement<br />RDF, c’est de la logique<br />Travaux en cours avec le LIRMM pour ADONIS sur les données Persée<br />Obl...
Page RDF complète<br />
Une pincée de RDA et de FRBR<br />
Conclusion<br />
Convertir en RDF<br />Aussi indéterminé que « convertir en Excel » !<br /><ul><li>Quelle modélisation ?
Quels vocabulaires réutiliser ?
Próximos SlideShares
Carregando em…5
×

Sudoc, Calames, theses.fr et le Web de données

Atelier sur le Web de données lors des Journées ABES 2011

Sudoc, Calames, theses.fr et le Web de données

  1. 1. Sudoc, Calames, theses.fret le Web de données<br />Atelier JABES2011<br />
  2. 2. Vers le Web de données<br />
  3. 3. Il faut participer au Web de données [Acquis]<br />
  4. 4. Objectifs de l’atelier<br />Faire un bilan d’étape<br />Montrer les données<br />Justifier certains choix<br />Expliquer comment ça marche<br />Manipuler quelques outils simples<br />Esquisser la suite du travail à mener<br />Nous<br />Vous<br />
  5. 5. Partons du connu<br />
  6. 6.
  7. 7. S’agit-il de données RDF ou d’une simple notice Dublin Core ?<br />
  8. 8. RDF nu<br />
  9. 9. about<br />En RDF, il faut expliciter de quoi on parle en l’identifiant par une URL : http://www.sudoc.fr/013041932/id<br />http://www.sudoc.fr/013041932/id est l’identifiant du document décrit<br />http://www.sudoc.fr/013041932/id est décrit à cette page-là http://www.sudoc.fr/013041932<br />
  10. 10. triplets<br />En RDF, tout est décomposé en triplets<br />Chaque triplet est indépendant<br />Chaque triplet pourrait être stocké séparément<br /><ul><li> Pas de notice finie
  11. 11. Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/id
  12. 12. Interopérabilité. Extensibilité. </li></li></ul><li>Identifier la langue avec le référentiel Lexvo<br />
  13. 13.
  14. 14. Mettre en relation un document et une langue<br />La langue n’est pas un code (‘fre’)<br />La langue est une entité à part entière<br />Avec son propre identifiant http://lexvo.org/id/iso639-3/fra<br />et ses propres propriétés<br />La propriété dcterms:language met en relation deux entités<br />
  15. 15. http://www.lexvo.org/id/iso639-3/fra décrite en HTML <br />
  16. 16. http://www.lexvo.org/id/iso639-3/fra décrite en RDF<br />
  17. 17. De fil en aiguille<br />La description de la langue poursuit la description du document Sudoc<br />Où s’arrêter ?<br />C’est sans fin<br />C’est le Web de données<br />
  18. 18. Identifier les personnes avec IdRef<br />
  19. 19.
  20. 20. IdRef, fournisseur d’identifiants et de référentiels<br />www.idref.fr = application Web ouverte<br />Ouverte sur le Web de données<br />Ouverte à d’autres applications IST (France)<br />Par son Web Service de recherche<br />Par ses fonctions d’intégration (Javascript)<br />Différents moyens/services pour récupérer et exploiter les identifiants et les données des autorités Sudoc ABES.<br />
  21. 21. IDREF Autorités Sudoc<br />Sudoc et IdRef<br />Sudoc<br />
  22. 22. Les autorités Sudoc,pivot du Linked data ABES<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours (2011)<br />Autorités Sudoc<br />Calames<br />
  23. 23. RDFa de Calames<br />Pas de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2010914119419211<br />Pour révéler le RDF caché ,<br />utiliser un outil comme<br />
  24. 24. http://www.calames.abes.fr/pub/ms/Calames-2010914119419211<br />RDFa de Calames<br />
  25. 25. RDFa de theses.fr<br />Pas encore de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802<br />Pour révéler le RDF caché ,<br />utiliser un outil comme<br />
  26. 26. Les thèsesportant sur les correspondants de Goethe<br />PREFIX foaf: <http://xmlns.com/foaf/0.1/><br />PREFIX dc: <http://purl.org/dc/elements/1.1/><br />PREFIX ead: <info:ms#><br />PREFIX tef: <http://www.abes.fr/abes/documents/tef/><br />SELECT ?these<br />{<br />?ms dc:creator <http://www.abes.fr/su/res/026895528>.<br />?ms ead:destinataire ?destinataire.<br />?these a tef:Thesis.<br />?these dc:subject ?destinataire<br />}<br />La requête exploite les données Calames et STAR<br />
  27. 27. Lier les données à IdRef, au-delà de l’ABES<br />
  28. 28. Linked data IST.fr ?<br />?<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours ( 2011)<br />Autorités Sudoc<br />Plateforme pédagogiq. ?<br />HAL ?<br />revues.<br />org ?<br />Presses univ. de Y ?<br />Calames<br />Persée ?<br />
  29. 29. IdRef comme nœud régional<br />Positionnement d’IdRef : IST français<br />En complémentarité avec d’autres fournisseurs d’identifiants et de référentiels :<br />Local : identifiants propres à une application, à un annuaire<br />Régional : BnF, auteurs HAL, CERL, DAI (NL)<br />Global : VIAF, DBpedia<br />
  30. 30. Autorités BnF<br />DBpedia<br />VIAF<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogiq. ?<br />HAL ?<br />revues.<br />org ?<br />Presses univ. de Y ?<br />Calames<br />Persée ?<br />
  31. 31. Lier les données de l’IST entre elles, au-delà d’IdRef<br />
  32. 32. Linked data IST.fr ? Les labos !<br />?<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogique X<br />HAL<br />revues.<br />org<br />Presses univ. de Y<br />Calames<br />Référentiel des laboratoires<br />Persée<br />
  33. 33. Linked data IST.fr ? Les affiliations<br />PRISMES (AMUE) locaux<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogique X<br />HAL<br />revues.<br />org<br />Presses univ.s de Y<br />Calames<br />Référentiel des laboratoires<br />Persée<br />
  34. 34. On parle de la même chose<br />owl:sameAs<br />
  35. 35. Identifier et nommer les personnes avec IdRef<br />
  36. 36.
  37. 37. Identifier les concepts avec IdRef et RAMEAU<br />
  38. 38.
  39. 39. IdRef et Rameau<br />Identifiants IdRef pour Rameau<br />A lier aux identifiants canoniques, ceux du centre national Rameau (BnF) quand ils seront officiellement publiés.<br />MeSH<br />Dewey<br />
  40. 40. Préciser le rôle des agents avec les MARC Relators<br />
  41. 41.
  42. 42.
  43. 43. L’embarras du choix ?<br />dcterms:creator<br />dcterms:contributor<br />marcrel:aut<br />rda:authorWork<br />tef:auteur ?<br />
  44. 44. Qui utilise explicitementmarcrel:aut<br /> utilise implicitementdc:contributor<br />
  45. 45. Raisonnement<br />Le Sudoc dit :<br />http://www.sudoc.fr/012367206/id marcrel:aut http://www.idref.fr/ 026975262 /id<br />La Bibliothèque du Congrès dit (ici) :<br />Marcrel:autrdfs:subPropertyOfdc:contributor<br />Un outil de raisonnement pourra en déduire que :<br />http://www.sudoc.fr/012367206/id dc:contributor http://www.idref.fr/ 026975262 /id<br />
  46. 46. Qui utilise marcrel:aut<br /> peut également tef:auteur,<br />malgré la redondance apparente<br />
  47. 47. tef:auteur<br />Ne semble rien dire de plus que marcrel:aut<br />Mais possède une propriété intéressante :<br />C’est une propriété fonctionnelle<br />= <br />Une thèse ne peut avoir qu’un auteur<br />= <br />si une thèse a deux auteurs, c’est deux fois le même !<br />
  48. 48. Raisonnement<br />Quelqu’un dit :<br />http://www.sudoc.fr/012367206/id tef:auteur http://www.idref.fr/035200898/id<br />Quelqu’un d’autre dit :<br />http://www.sudoc.fr/012367206/id tef:auteur http://www.viaf.org/123456789<br />Une ontologie TEF dit :<br />http://www.abes.fr/tef/auteur rdf:typeowl:ObjectPropertyowl:FunctionalProperty<br />(une thèse ne peut avoir qu’1 auteur, au sens de tef:auteur)<br />(mais elle peut avoir 2 dc:creator)<br />Un outil de raisonnement pourra en déduire que :<br />http://www.idref.fr/035200898/id owl:sameAs http://www.viaf.org/123456789<br />
  49. 49. Démo<br />Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt<br />Outils de raisonnement :<br />http://www.ivan-herman.net/Misc/2008/owlrl/<br />http://inspector.sindice.com<br />
  50. 50. Raisonnement<br />RDF, c’est de la logique<br />Travaux en cours avec le LIRMM pour ADONIS sur les données Persée<br />Oblige à qualité des données et rigueur de la modélisation<br />Sinon : on génère n’importe quoi !<br />Usages :<br />Enrichir les données<br />Expliciter les données<br />Mettre au jour des incohérences<br />
  51. 51. Page RDF complète<br />
  52. 52.
  53. 53. Une pincée de RDA et de FRBR<br />
  54. 54. Conclusion<br />
  55. 55. Convertir en RDF<br />Aussi indéterminé que « convertir en Excel » !<br /><ul><li>Quelle modélisation ?
  56. 56. Quels vocabulaires réutiliser ?
  57. 57. Forger son propre vocabulaire ?
  58. 58. Nos données historiques sont-elles éligibles à ces nouvelles modélisations ?</li></ul>cf. notre dc:format et notre dc:publisher<br />
  59. 59. Trois lièvres à la fois<br />
  60. 60. La suite<br />Enrichir encore les conversions en RDF<br />Multiplier si nécessaire les vocabulaires employés, sans craindre les redondances<br />Ajouter des liens internes et externes (IST française, BnF, OCLC, Dbpedia, Freebase, etc.)<br />Encourager les partenaires à diffuser leurs données en RDF, en s’appuyant sur des référentiels communs (IdRef)<br />Continuer à exploiter ces données en RDF avec le LIRMM et d’autres<br />

    Seja o primeiro a comentar

    Entre para ver os comentários

  • Marie_Idille

    Jun. 1, 2011
  • bobb81

    Jun. 8, 2011
  • christinerobert

    Mar. 8, 2012
  • 27point7

    Apr. 13, 2013

Atelier sur le Web de données lors des Journées ABES 2011

Vistos

Vistos totais

2.390

No Slideshare

0

De incorporações

0

Número de incorporações

13

Ações

Baixados

12

Compartilhados

0

Comentários

0

Curtir

4

×