SlideShare uma empresa Scribd logo
1 de 89
Métadonnées urbi et orbi  Mécanismes et enjeux du Web de données, de l'échelle locale à l'échelle du Web y. nicolas  : abes :: formation enssib ::: dirbu 31 mars 2011
Métadonnées C’est quoi les
Métadonnées = ? Information structurée et réutilisable sur (…) Exemples Une page de titre papier est structurée, mais n’est pas réutilisable Une notice MARC  = un ensemble de métadonnées 3
Cette thèse a pour directeur Untel 4
Cette thèse a pour directeur Untel ,[object Object],5
Cette thèse a pour directeur Untel ,[object Object],Qui a un partenariat avec telle entreprise 6
Cette thèse a pour directeur Untel ,[object Object],Qui a un partenariat avec telle entreprise ,[object Object],7
Cette thèse a pour directeur Untel ,[object Object],Qui a un partenariat avec telle entreprise ,[object Object]
Qui est dirigé par tel chercheur’8
Cette thèse a pour directeur Untel ,[object Object],Qui a un partenariat avec telle entreprise ,[object Object]
Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue 9
Cette thèse a pour directeur Untel ,[object Object],Qui a un partenariat avec telle entreprise ,[object Object]
Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue Qui a publié tel chercheur’’ 10
Cette thèse a pour directeur Untel ,[object Object],Qui a un partenariat avec telle entreprise ,[object Object]
Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue Qui a publié tel chercheur’’ Etc. Où s’arrêter ? 11
MétadonnéesOù s’arrêter ? La notice n’est pas la frontière La base de données n’est pas la frontière Le Web est la frontière ,[object Object],Modèle du graphe Des réseaux qui peuvent s’étendre et s’interconnecter à l’infini Des trajectoires directes ou non entre deux points A travers les frontières ordinaires (langues, administratives, normes…) 12
13
Les métadonnées de thèse,c’est… toute information structurée …  … qui concerne de près ou de loin la thèse peu importe la structure peu importe le format peut importe le type d’entité dont on parle : Document Personne Organisme Concept 14
Les métadonnées ne se laissent pas enfermer dans un document-notice
Les métadonnées ne parlent pas que des documents Elles parlent de tout
Les métadonnées ne sont pas la seule affaire des bibliothécaires Nos métadonnées ne sont pas seulement les nôtres
Les métadonnées, ce n’est pas plouc Même Google s’y intéresse
Google ne comprend que ses propres vocabulaires de métadonnées ?
Avec Good Relations, on voit que Google adopte un standard de métadonnées du e-commerce. Quid de nos standards à nous ?
Breaking News: Google is now officially recommending UNIMARC
Mais, être pris en considération par Google n’est pas le seul enjeu
Soucis enjeux
souciDilemme de l’interopérabilité Riche et seul Réduire la richesse de ses métadonnées pour les mettre au niveau d’autres métadonnées Dublin Core Conserver la richesse de ses métadonnées mais sans pouvoir se faire comprendre MARC TEF EAD Sociable mais pauvre
souciAgréger des données hétérogènes Difficile de mixer des notices On juxtapose On fusionne parfois On n’agrège pas vraiment
souciFrontières institutionnelles Institutions comme mères possessives des métadonnées Conflit d’intérêt chez chacune Produire, gérer, publier les données Exploiter les données, construire des outils l’outil et des interfaces l’interface Lutte pour le monopole entre elles Qui agrège les données des uns et des autres ? Coordination lourde et lente
Les questions techniques cachenttrèssouvent des problèmespolitiques Christophe Pérales, 2010
Bibliothèque virtuelle Machin bureaucratique ou  Mashup ?
Place de marché : producteurs et consommateurs
Les choix techniques  peuventrésoudre certainsproblèmespolitiques Bibi, 31 mars 2011
souciFrontières interprofessionnelles Faire cohabiter voire interagir les données Vaudeville : Calames : bibliothécaires et chercheurs Sudoc : bibliothécaires et éditeurs ou agrégateurs STAR et STEP (thèses en cours) : bibliothécaires et gestionnaires (scolarité, recherche) Theses.fr : public et privé Etc.
souciLes données prisonnières des outils Les données et les traitements sur les données doivent survivre aux outils « Résultats fusionnés » = travail dissimulé sur les données
Recyclage : agréger, enrichir, republier
Un autre CCfr ? Inspection en cours Proposition : Un opérateur agrège, traite, enrichit les données et les renvoie aux producteurs Un autre opérateur construit une interface Web et des Web services Qui veut construit d’autres interfaces, ad hoc, de niche, expérimentales, mashups …
souciManque d’imaginationBiais The coolest thing to do with your data will be thought of by someone else Rufus Pollock, 2007
souciQualité des données Ouverture des donnéesvsSoin des données Dilemme ? Cerclevertueux ? Qu’est-ceque de bonnesdonnées ?
Data quality is multidimensional, and involves data management, modelling and analysis, quality control and assurance, storage and presentation. (..) data quality is related to use and cannot be assessed independently of the user. Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for the Global Biodiversity Information Facility, Copenhagen.
souciQualité des données Bonnesdonnées = Bonnes à quoi ? Maissi les donnéessontouvertes, on ignore leur usage ! Aporie Jusqu’oùaller ? QuellesconsignesdansSudoc, Calames, STAR ? Miser sur le contenutextuel ? Miser sur les liens aux référentielset à d’autresdonnéesfiables et stables ?
Vers un Web de métadonnées RDF 47
RDF Standard W3C Existe depuis 1998, mais décolle aujourd’hui Resource Description Framework Cadre général pour décrire n’importe quoi Tout peut être « resource » à décrire RDF, modèle universel pour intégrer toute information au Web de données 48
http://www.theses.fr/2009TOUR3802/id dcterms:creator http://www.idref.fr/142976903/id Cette thèse … … a pour auteur … … untel. 49
http://www.theses.fr/2009TOUR3802/id http://purl.org/dc/terms/creator http://www.idref.fr/142976903/id La relation creator est également identifiée par une URL 50
Démo 52
Comment publier ses métadonnées en RDF ? Mettre du RDF dans ses pages HTML RDFa (RDF dans les attributs HTML) Calames Thèses de STAR : www.theses.fr/{Numéro_national_de_Thèse} Publier un document RDF à part RDF en XML (ou autre format) Autorités Sudoc dans IdRef 53
Et si je veux voir ce RDF ? ,[object Object]
Mais je veux voir !
Outils
Tabulator: naviguer dans le RDF
Operator: extraire le RDF du HTML+RDFa
SindiceInspector: analyser et valider le RDF
RDFa distiller : extraire et valider le RDFa54
Nos métadonnées et les moteurs Google Richsnippets RDFa à la Google pour Google Pas possible de parler de thèses, de documents Mais on peut parler de personnes, d’entreprises, de produits… Sindice Moteur spécialisé dans les données sémantiques Les moteurs explorent, moissonnent De plus en plus vont agréger et faire raisonner nos métadonnées Seulement le début… 55
RDF :: Souci en moinsDilemme de l’interopérabilité seul et sociable pauvre et riche tef:auteur rdfs:subPropertyOf dc:creator
RDF :: moins de souciAgréger des données hétérogènes Ne pas juxtaposer des notices Agréger des triplets RDF Et plus si affinités (inférences)
RDF : moins de souciFrontières institutionnellesFrontières interprofessionnelles Manque d’imaginationBiais Plus de frontières Tout le monde peut dire n’importe quoi sur n’importe quoi Pour le meilleur Pour le pire
RDF :: souci en moinsLes données prisonnières des outils Ni des outils Ni des formats (RDF n’est pas un format) Ni des vocabulaires Mais : Attention à la conceptualisation Attention aux faux-amis
Souci toujoursQualité des données Le problèmeresteentier Miser sur la qualité de nosdonnées ! AOC des données (provenance) Les machines ne font pas tout !
Linked data Vers un Web de données liées Credo : “Use URIs as names for things  Use HTTP URIs so that people can look up those names.  When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)  Include links to other URIs. so that they can discover more things. “ Tim Berners Lee, 2006
The Linking Open Data cloud Linking Open Data clouddiagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
DBpedia Wikipedia en RDF http://dbpedia.org/About De facto, vaste base de connaissance sur laquelle les corpus RDF se règlent. Le mapping : exemple BBC/DBPedia
http://www.w3.org/DesignIssues/LinkedData.html
Les métadonnées comme services ABES 65
Calendrier
Les autorités Sudoc,pivot du Linked data ABES theses.fr Sudoc Thèses soutenues et Thèses en cours (2011) Autorités Sudoc Calames
Portail des thèses
Linked data IST.fr ? ? theses.fr Sudoc Thèses soutenues et Thèses en cours ( 2011) Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ. de Y Calames Persée
Linked data IST.fr ? Les labos ! ? theses.fr Sudoc Thèses soutenues et Thèses en cours ( 2011) Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée
Linked data IST.fr ? Les affiliations PRISMES (AMUE) locaux theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée
Authentification, habilitation et données liées Problème :  dans theses.fr, on veut associer des droits spécifiques aux auteurs de thèse (stats, être contacté) Comment reconnaître un utilisateur en tant qu’auteur Solution ? Authentification Shibboleth avec « être l’auteur de telle thèse » comme propriété discriminante
Linked data IST.fr ? Les brevets brevets theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée + données de recherche, cahiers de laboratoire, congrès…
Système(s) d’information de la recherche Interconnecter nos bases Ne pas enfermer les données dans de nouveaux outils Partager ce qui peut l’être Se coordonner sans coopérer (sic)
Leibniz, Lettre à Arnauld, 30 avril 1687 77
Scénarios On ouvre les données et « servez-vous ! » On offre aussi des services pour faciliter la tâche C’est le sens d’IdRef
IdRef Une application sur mesure pour « servir » les Référentiels Sudoc et partager leurs Identifiants 2 fonctions : Chercher des autorités et y lier ses données Enrichir le référentiel d’autorités (créer, modifier) 2 moyens Se « brancher » sur l’application Web 	cuit Exploiter les Web Services 			mi-cuit Données ouvertes				cru

Mais conteúdo relacionado

Mais procurados

États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
Ivan Herman
 

Mais procurados (20)

Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Les ontologies et les graphes RDF
Les ontologies et les graphes RDFLes ontologies et les graphes RDF
Les ontologies et les graphes RDF
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantique
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifié
 
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantique
 
RDF en quelques slides
RDF en quelques slidesRDF en quelques slides
RDF en quelques slides
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèques
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 

Destaque

2 trabajo final_grupo102058_115
2 trabajo final_grupo102058_1152 trabajo final_grupo102058_115
2 trabajo final_grupo102058_115
luismorc
 
Univers virtuels et_enseignement_de_medecine_de_catastrophe-2
Univers virtuels et_enseignement_de_medecine_de_catastrophe-2Univers virtuels et_enseignement_de_medecine_de_catastrophe-2
Univers virtuels et_enseignement_de_medecine_de_catastrophe-2
Moiraud Jean-Paul
 
Territoires : l'incontournable de l'aménagement du territoire au Québec!
Territoires : l'incontournable de l'aménagement du territoire au Québec!Territoires : l'incontournable de l'aménagement du territoire au Québec!
Territoires : l'incontournable de l'aménagement du territoire au Québec!
ACSG - Section Montréal
 
Edgar mueller
Edgar muellerEdgar mueller
Edgar mueller
chukyxD
 

Destaque (20)

Crowdfunding Einführung
Crowdfunding EinführungCrowdfunding Einführung
Crowdfunding Einführung
 
Prolonger la vie d'une application
Prolonger la vie d'une applicationProlonger la vie d'une application
Prolonger la vie d'une application
 
Überblick Crowdfunding-Plattformen in Deutschland (Team 1)
Überblick Crowdfunding-Plattformen in Deutschland (Team 1)Überblick Crowdfunding-Plattformen in Deutschland (Team 1)
Überblick Crowdfunding-Plattformen in Deutschland (Team 1)
 
2 trabajo final_grupo102058_115
2 trabajo final_grupo102058_1152 trabajo final_grupo102058_115
2 trabajo final_grupo102058_115
 
Bolsa de valores mate
Bolsa de valores mateBolsa de valores mate
Bolsa de valores mate
 
Preguntas.respuestas
Preguntas.respuestasPreguntas.respuestas
Preguntas.respuestas
 
De l’apprentissage individuel au collaboratif : retour d’expérience du CS22 à...
De l’apprentissage individuel au collaboratif : retour d’expérience du CS22 à...De l’apprentissage individuel au collaboratif : retour d’expérience du CS22 à...
De l’apprentissage individuel au collaboratif : retour d’expérience du CS22 à...
 
Deviser
DeviserDeviser
Deviser
 
monumentos de Burgos. Alejandro R.
monumentos de Burgos. Alejandro R.monumentos de Burgos. Alejandro R.
monumentos de Burgos. Alejandro R.
 
La feminització de la professió mèdica. ¿Una moda o una tendència crònica?
La feminització de la professió mèdica. ¿Una moda o una tendència crònica? La feminització de la professió mèdica. ¿Una moda o una tendència crònica?
La feminització de la professió mèdica. ¿Una moda o una tendència crònica?
 
Bilan d'activité
Bilan d'activitéBilan d'activité
Bilan d'activité
 
9. frecuencias
9. frecuencias9. frecuencias
9. frecuencias
 
Produktvergleiche - Services für die Strategie- und Managementberatung
Produktvergleiche - Services für die Strategie- und ManagementberatungProduktvergleiche - Services für die Strategie- und Managementberatung
Produktvergleiche - Services für die Strategie- und Managementberatung
 
Wlan
WlanWlan
Wlan
 
Univers virtuels et_enseignement_de_medecine_de_catastrophe-2
Univers virtuels et_enseignement_de_medecine_de_catastrophe-2Univers virtuels et_enseignement_de_medecine_de_catastrophe-2
Univers virtuels et_enseignement_de_medecine_de_catastrophe-2
 
Rosen
RosenRosen
Rosen
 
Territoires : l'incontournable de l'aménagement du territoire au Québec!
Territoires : l'incontournable de l'aménagement du territoire au Québec!Territoires : l'incontournable de l'aménagement du territoire au Québec!
Territoires : l'incontournable de l'aménagement du territoire au Québec!
 
Jabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de donnéesJabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de données
 
Freiräume für Journalismus.
Freiräume für Journalismus.Freiräume für Journalismus.
Freiräume für Journalismus.
 
Edgar mueller
Edgar muellerEdgar mueller
Edgar mueller
 

Semelhante a metadata_pour_dirbu_mars2011

Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étages
SemWebPro
 
Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services?
chessmu
 
03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantique
badirh
 

Semelhante a metadata_pour_dirbu_mars2011 (20)

Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)
 
Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étages
 
Armadillo - Web sémantique, les outils d’un open data culturel
Armadillo  - Web sémantique, les outils d’un open data culturelArmadillo  - Web sémantique, les outils d’un open data culturel
Armadillo - Web sémantique, les outils d’un open data culturel
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!!
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services?
 
Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Concepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSConcepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSS
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantique
 
Sp6 Yann Nicolas
Sp6 Yann NicolasSp6 Yann Nicolas
Sp6 Yann Nicolas
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 

Mais de Y. Nicolas

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
Y. Nicolas
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
Y. Nicolas
 

Mais de Y. Nicolas (15)

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
 
web de données / bib
web de données / bibweb de données / bib
web de données / bib
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
 
Le Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnéesLe Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnées
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 

Último

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
Faga1939
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 

Último (18)

Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Cours
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 

metadata_pour_dirbu_mars2011

  • 1. Métadonnées urbi et orbi Mécanismes et enjeux du Web de données, de l'échelle locale à l'échelle du Web y. nicolas : abes :: formation enssib ::: dirbu 31 mars 2011
  • 3. Métadonnées = ? Information structurée et réutilisable sur (…) Exemples Une page de titre papier est structurée, mais n’est pas réutilisable Une notice MARC = un ensemble de métadonnées 3
  • 4. Cette thèse a pour directeur Untel 4
  • 5.
  • 6.
  • 7.
  • 8.
  • 9. Qui est dirigé par tel chercheur’8
  • 10.
  • 11. Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue 9
  • 12.
  • 13. Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue Qui a publié tel chercheur’’ 10
  • 14.
  • 15. Qui est dirigé par tel chercheur’Qui appartient au comité de telle revue Qui a publié tel chercheur’’ Etc. Où s’arrêter ? 11
  • 16.
  • 17. 13
  • 18. Les métadonnées de thèse,c’est… toute information structurée … … qui concerne de près ou de loin la thèse peu importe la structure peu importe le format peut importe le type d’entité dont on parle : Document Personne Organisme Concept 14
  • 19. Les métadonnées ne se laissent pas enfermer dans un document-notice
  • 20. Les métadonnées ne parlent pas que des documents Elles parlent de tout
  • 21. Les métadonnées ne sont pas la seule affaire des bibliothécaires Nos métadonnées ne sont pas seulement les nôtres
  • 22. Les métadonnées, ce n’est pas plouc Même Google s’y intéresse
  • 23.
  • 24.
  • 25.
  • 26.
  • 27. Google ne comprend que ses propres vocabulaires de métadonnées ?
  • 28.
  • 29. Avec Good Relations, on voit que Google adopte un standard de métadonnées du e-commerce. Quid de nos standards à nous ?
  • 30. Breaking News: Google is now officially recommending UNIMARC
  • 31. Mais, être pris en considération par Google n’est pas le seul enjeu
  • 33. souciDilemme de l’interopérabilité Riche et seul Réduire la richesse de ses métadonnées pour les mettre au niveau d’autres métadonnées Dublin Core Conserver la richesse de ses métadonnées mais sans pouvoir se faire comprendre MARC TEF EAD Sociable mais pauvre
  • 34. souciAgréger des données hétérogènes Difficile de mixer des notices On juxtapose On fusionne parfois On n’agrège pas vraiment
  • 35. souciFrontières institutionnelles Institutions comme mères possessives des métadonnées Conflit d’intérêt chez chacune Produire, gérer, publier les données Exploiter les données, construire des outils l’outil et des interfaces l’interface Lutte pour le monopole entre elles Qui agrège les données des uns et des autres ? Coordination lourde et lente
  • 36. Les questions techniques cachenttrèssouvent des problèmespolitiques Christophe Pérales, 2010
  • 37.
  • 38.
  • 39.
  • 40. Bibliothèque virtuelle Machin bureaucratique ou Mashup ?
  • 41. Place de marché : producteurs et consommateurs
  • 42. Les choix techniques peuventrésoudre certainsproblèmespolitiques Bibi, 31 mars 2011
  • 43. souciFrontières interprofessionnelles Faire cohabiter voire interagir les données Vaudeville : Calames : bibliothécaires et chercheurs Sudoc : bibliothécaires et éditeurs ou agrégateurs STAR et STEP (thèses en cours) : bibliothécaires et gestionnaires (scolarité, recherche) Theses.fr : public et privé Etc.
  • 44. souciLes données prisonnières des outils Les données et les traitements sur les données doivent survivre aux outils « Résultats fusionnés » = travail dissimulé sur les données
  • 45. Recyclage : agréger, enrichir, republier
  • 46. Un autre CCfr ? Inspection en cours Proposition : Un opérateur agrège, traite, enrichit les données et les renvoie aux producteurs Un autre opérateur construit une interface Web et des Web services Qui veut construit d’autres interfaces, ad hoc, de niche, expérimentales, mashups …
  • 47. souciManque d’imaginationBiais The coolest thing to do with your data will be thought of by someone else Rufus Pollock, 2007
  • 48. souciQualité des données Ouverture des donnéesvsSoin des données Dilemme ? Cerclevertueux ? Qu’est-ceque de bonnesdonnées ?
  • 49. Data quality is multidimensional, and involves data management, modelling and analysis, quality control and assurance, storage and presentation. (..) data quality is related to use and cannot be assessed independently of the user. Chapman, A. D. 2005. Principles of Data Quality, version 1.0. Report for the Global Biodiversity Information Facility, Copenhagen.
  • 50. souciQualité des données Bonnesdonnées = Bonnes à quoi ? Maissi les donnéessontouvertes, on ignore leur usage ! Aporie Jusqu’oùaller ? QuellesconsignesdansSudoc, Calames, STAR ? Miser sur le contenutextuel ? Miser sur les liens aux référentielset à d’autresdonnéesfiables et stables ?
  • 51. Vers un Web de métadonnées RDF 47
  • 52. RDF Standard W3C Existe depuis 1998, mais décolle aujourd’hui Resource Description Framework Cadre général pour décrire n’importe quoi Tout peut être « resource » à décrire RDF, modèle universel pour intégrer toute information au Web de données 48
  • 55.
  • 57. Comment publier ses métadonnées en RDF ? Mettre du RDF dans ses pages HTML RDFa (RDF dans les attributs HTML) Calames Thèses de STAR : www.theses.fr/{Numéro_national_de_Thèse} Publier un document RDF à part RDF en XML (ou autre format) Autorités Sudoc dans IdRef 53
  • 58.
  • 59. Mais je veux voir !
  • 62. Operator: extraire le RDF du HTML+RDFa
  • 64. RDFa distiller : extraire et valider le RDFa54
  • 65. Nos métadonnées et les moteurs Google Richsnippets RDFa à la Google pour Google Pas possible de parler de thèses, de documents Mais on peut parler de personnes, d’entreprises, de produits… Sindice Moteur spécialisé dans les données sémantiques Les moteurs explorent, moissonnent De plus en plus vont agréger et faire raisonner nos métadonnées Seulement le début… 55
  • 66. RDF :: Souci en moinsDilemme de l’interopérabilité seul et sociable pauvre et riche tef:auteur rdfs:subPropertyOf dc:creator
  • 67. RDF :: moins de souciAgréger des données hétérogènes Ne pas juxtaposer des notices Agréger des triplets RDF Et plus si affinités (inférences)
  • 68. RDF : moins de souciFrontières institutionnellesFrontières interprofessionnelles Manque d’imaginationBiais Plus de frontières Tout le monde peut dire n’importe quoi sur n’importe quoi Pour le meilleur Pour le pire
  • 69. RDF :: souci en moinsLes données prisonnières des outils Ni des outils Ni des formats (RDF n’est pas un format) Ni des vocabulaires Mais : Attention à la conceptualisation Attention aux faux-amis
  • 70. Souci toujoursQualité des données Le problèmeresteentier Miser sur la qualité de nosdonnées ! AOC des données (provenance) Les machines ne font pas tout !
  • 71. Linked data Vers un Web de données liées Credo : “Use URIs as names for things Use HTTP URIs so that people can look up those names. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL) Include links to other URIs. so that they can discover more things. “ Tim Berners Lee, 2006
  • 72. The Linking Open Data cloud Linking Open Data clouddiagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  • 73. DBpedia Wikipedia en RDF http://dbpedia.org/About De facto, vaste base de connaissance sur laquelle les corpus RDF se règlent. Le mapping : exemple BBC/DBPedia
  • 75. Les métadonnées comme services ABES 65
  • 77. Les autorités Sudoc,pivot du Linked data ABES theses.fr Sudoc Thèses soutenues et Thèses en cours (2011) Autorités Sudoc Calames
  • 78.
  • 80.
  • 81. Linked data IST.fr ? ? theses.fr Sudoc Thèses soutenues et Thèses en cours ( 2011) Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ. de Y Calames Persée
  • 82. Linked data IST.fr ? Les labos ! ? theses.fr Sudoc Thèses soutenues et Thèses en cours ( 2011) Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée
  • 83. Linked data IST.fr ? Les affiliations PRISMES (AMUE) locaux theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée
  • 84. Authentification, habilitation et données liées Problème : dans theses.fr, on veut associer des droits spécifiques aux auteurs de thèse (stats, être contacté) Comment reconnaître un utilisateur en tant qu’auteur Solution ? Authentification Shibboleth avec « être l’auteur de telle thèse » comme propriété discriminante
  • 85. Linked data IST.fr ? Les brevets brevets theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée + données de recherche, cahiers de laboratoire, congrès…
  • 86. Système(s) d’information de la recherche Interconnecter nos bases Ne pas enfermer les données dans de nouveaux outils Partager ce qui peut l’être Se coordonner sans coopérer (sic)
  • 87. Leibniz, Lettre à Arnauld, 30 avril 1687 77
  • 88. Scénarios On ouvre les données et « servez-vous ! » On offre aussi des services pour faciliter la tâche C’est le sens d’IdRef
  • 89. IdRef Une application sur mesure pour « servir » les Référentiels Sudoc et partager leurs Identifiants 2 fonctions : Chercher des autorités et y lier ses données Enrichir le référentiel d’autorités (créer, modifier) 2 moyens Se « brancher » sur l’application Web cuit Exploiter les Web Services mi-cuit Données ouvertes cru
  • 91. Une application « pop up » pour ses applications « hôtes »
  • 92. Une application « pop up » pour ses applications « hôtes »
  • 93. Votre appli => IdRef => votre appli
  • 95. Des URL pérennes pour accéder aux données
  • 97. Bientôt un nouveau Web Service
  • 98. Web de données = (catalogage partagé)2 Contribuer au Web de données Documentaire Scientifique Patrimonial Miser sur l’ouverture et la qualité des données Empêcher les monopoles sur les données Moins dépendre des fournisseurs de logiciels Utiliser et valoriser la force de frappe des catalogueurs