SlideShare uma empresa Scribd logo
1 de 63
Référentiels et interoperabilité (1)

                 Antoine Isaac

    Europeana & Vrije Universiteit Amsterdam




                Séminaire INRIA IST
              Carnac, 2 Octobre 2012
Avertissement !
• Le web de données ne matérialise pas la notion de
  “référentiel”
   Tout comme le web “traditionel”: techniquement rien ne distingue
     un “site de référence” d’un autre



• Mais il y a quand même des ressources qui peuvent
  prétendre au statut de référence pour une ou plusieurs
  communautés
Catégories de référentiels possibles
Inspiration: rapports du groupe d’incubation du W3C
   “Bibliothèques et web de données”

• Élements de métadonnées

• Vocabulaires de valeurs

• Jeux de données




             http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/
Des catégories pas forcément disjointes?
“Ontologie” a pu être utilisé pour divers “référentiels
  sémantiques”




                                                          [Smith 2001]
Des catégories pas forcément disjointes?

• Conceptuellement, elles expriment “de la sémantique”

• Parfois un artefact appartient à deux catégories

• Mais d’un point de vue technique (semantic web stack) il y a
  une vraie différence
Eléments de métadonnées

A.k.a ontologies OWL, metadata element sets

• Fournissent les classes et propriétés qui servent de support à
  l’expression des descriptions

• Types d’ontologies selon la portée
   ontologie noyau vs. ontologie de domaine vs. ontologie d’application
“Briques de construction” des graphes RDF


 myMES:Article

                 rdf:type


          http://example.org/article1




myMES:suject


   myVV:Amsterdam
Ontologies par “popularité” sur le Linked
              Data Cloud




           http://www4.wiwiss.fu-berlin.de/lodcloud/state/#terms
Dans l’inventaire Library Linked Data




http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Metadata_Element_Sets
Dublin Core

DCMI Metadata Terms                                dublincore.org/


• A l’origine, 15 éléments généraux pour tous types de
  documents
   dc:title, dc:creator, dc:coverage, dc:subject
• Spécialisés en éléments plus spécifiques, avec par ex.
  domaines et ranges
   dcterms:spatial, dcterms:creator
   dcterms:Agent
• Utilisable pour relier des resources, pas seulement des
  descriptions “à plat”
• Effort communautaire
FOAF

Friend of a Friend                            www.foaf-project.org/


• Décrire des personnes – réseaux sociaux, pages
  personnelles…
• Porté par deux personnes, retour d’expérience des
  utilisateurs
• Approche très pragmatique
OAI-ORE
                                         www.openarchives.org/ore/
Open Archives Initiative - Object Reuse and Exchange



• Décrire des aggrégations de resources qui composent des
  ressources numériques complexes
• Eléments clefs
   –   Aggrégation
   –   Ressource aggrégée
   –   “Proxy”
   –   “Resource map”
• Communauté OAI
   cf. OAI-PMH
Bibo
• Bibliographic Ontology                             bibliontology.com/


• Ontologie pour les ressources bibliographiques
   – Categorisation de documents (AcademicArticle)
   – Structure des documents (chapter…)
   – Citation (citedBy)
• Créée par deux personnes
FRBR
• Modèle conceptuel développé par l’IFLA
• Il existe plusieurs ontologies (FRBRer, FRBRcore, FRBRoo)
Schema.org
• Représenter dans les pages web des informations de base sur
  les objets qu’elle représentent
   Videos, Volcans, Sex shops…
• Moteurs de recherche (Bing, Google, Yahoo!)
• Approche top-down, mais très pragmatique
Et bien d’autres…
• CIDOC-CRM
• W3C Media Ontology
• Music Ontology
…
Où les trouver ?
Rapports
• Library Linked Data
           www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/

Moteurs de recherche
• Sindice                                         sindice.com
• Watson                               watson.kmi.open.ac.uk/

Répertoires
• Linked Open Vocabularies            lov.okfn.org/dataset/lov/
• Open Metadata Registry                  metadataregistry.org
Linked Open Vocabularies
Etude de cas : la création du Europeana
              Data Model




           http://pro.europeana.eu/edm-documentation
?
Europeana

Service qui donne accès aux objets numérisés du domaine
  patrimonial européen

• Portail liés aux portails des institutions et projets
  partenaires
                                                          europeana.eu
• Services de données:
   – API                                       pro.europeana.eu/api
   – Linked Data                                  data.europeana.eu
Qui envoie des données à Europeana?
       Horizontal Aggregators                                    Vertical Aggregators
          Archives                                               National Aggregators

                                                                          Culture Grid



                  APEnet

      Libraries
                  The European Library                                                       GLAMs

                                                                 Regional Aggregators
                                         “Dark” Aggregators            Flanders museums
                                         ATHENA     ELocal
                    Film archives

European Film Gateway




                                                              Mn;kl;k;klj;lkj;lkj;jh;lkj;klj;klj;
                                                                     GLAMs
                             Museums              GLAMs                                   klj;klj
Qu’est-ce qui est envoyé à Europeana?




          1. Thumbnails

            2. Metadata

  3. Links to digital objects online
Résoudre un problème d’intégration
               de données

Construire un service d’accès utilisant les métadonnées est difficile

•   Chaque domaine utilise ses propres modèles et formats
     LIDO, EAD…

•   Solution actuelle: les partenaires fournissent des métadonnées au
    format Europeana Semantic Elements (ESE)
     –   Plus grand commun dénominateur pour les métadonnées
     –   Données “à plat”
     –   Ne respectent pas le “one-to-one principle”
     –   Perte de la richesse des metadonnées orginelles
Plus de “sémantique” pour l’accès aux objets
Construire une “couche sémantique” au-dessus des objets
Services assistés par la sémantique

• Exploitation de relations comme: “localisé à”, “a pour sujet”,
  “concept plus générique”, correspondences entre langues,
  domaines
   – Reformulation de requêtes
   – Regroupement et personnalisation de résultats


• Échanger des données plus riches

• Les données plus riches sont souvent déjà là !
   – Thesauri, classifications…
   – Éléments de données complexes (EAD, MARC)
   – Dans le domaine patrimonial ou ailleurs
EDM design requirements
Données plus fines

•   Distinction entre l’"objet fourni (tableau, livre…) et ses
    représentations numériques
•   Distinction entre l’objet et ses descriptions
•   Permettre plusieurs descriptions pour un objet
    Contenant éventuellement des assertions contradictoires
•   Représentation d’objets complexes
•   Ressources contextuelles, y compris concepts
EDM design requirements

Données plus interopérables

•   Permettre la co-existence de plusieurs grains de données
    Autoriser des profils spécifiques à un domaine
•   Réutiliser et étendre des éléments de standards existants
EDM : les bases

• OAI ORE pour l’organisation des metadonnées et des
  représentations numériques des objets

• Dublin Core pour une partie des metadonnées
  descriptives

• CIDOC-CRM comme inspiration pour la structure des
  événements et des relations entre objets

• SKOS et d’autres référentiels pour les ressources
  contextuelles
Exemple - 1




              30
Exemple - 2




              31
Aggregations OAI ORE
 organiser la “contribution” d’un partenaire

provenance                               digital representation
 metadata




          aggregation
                                                                  object

                                                                           32
Proxys OAI ORE
Représenter une “vue” sur les objets




                                            object
                                           metadata
                                   proxy




                                                      33
Plusieurs fournisseurs = plusieurs aggregations



                                  DMF proxy



                                                       DMF title


           The “real” painting




                                 Louvre Proxy


                                                Louvre title       34
Europeana comme un “simple” fournisseur de
             metadonnées normalisées et enrichies




Europeana
aggregation




                                                             35
                                                “enriched”
                                                metadata
Entités contextuelles
Récupér et exploiter des données “orginelles” ou enrichies réclame plus
   que des descriptions centrées objet
Evénements, lieux, agents, concepts
Objets et événements
EDM est un effort collaboratif

•   Europeana v1.0 WP3: 60 participants

•   Développement semi-ouvert, “en aquarium”

•   Transversal
    – Experts des bibliothèques, archives et musées
    – Avec EDM, Europeana devient plus compatible avec les besoins de
      communautés spécifiques. Il est aussi possible de créer des “profils”
      d’EDM pour ces communautés
Bénéfices de l’approche web de données
       pour la conception d’EDM

• Vocabulaires à réutiliser
• Approche flexible de la conception et la ré-utilisation de
  standards
• Ontologies spécifiques co-existant avec les ontologies
  standards
• Pas de contrainte sur le grain du modèle de données
• Facilité technique de la connection et la publication des
  données
• Vision qui appuie les stratégies Open Data
Retour aux éléments de métadonnées
            – ou presque
EDM




Elément de (méta)données




Concept d’un vocabulaire d’autorité


                                            41
SKOS



Simple Knowledge Organization System

Portée: knowledge organization systems (KOS) comme les
  thesauri, systèmes de classification, autorités matières…

SKOS permet de représenter et d’échanger les KOS en RDF de
  manière simple
Représenter la sémantique

La manière formalisée: OWL Semantic Web ontology language

Ontologies avec une sémantique exploitable par la machine
• Mère est une classe
• C’est l’intersection des classes Femme et Parent
• Parent est la classe des ressources de type Personne qui
  sont liés à au moins une autre ressource de type Personne
  en utilisant la propriété estParentDe
…
SKOS n’est pas pour des ontologies
                  formelles
• Il est possible de produire des ontologies à partir de KOS,
  mais les KOS
   – Se concentrent souvent sur les données lexicales
       Enfant UtiliséPour Progéniture
   – Ont une sémantique plus “molle”
       Parent TermeLié Enfant
   – Sont parfois gigantesques et donc difficiles à “nettoyer”



• Et pourtant en tant que tels les KOS peuvent être utiles à de
  nombreuses applications!
   Recherche sémantique, annotation…
SKOS – les bases

  Pour satisfaire la majorité des besoins

  •    Concepts
  •    Propriétés lexicales
  •    Liens sémantiques
  •    Notes




Sémantique et interopérabilité
Un thesaurus fictif

Animals

cats
   UF   ( used for ) domestic cats
   RT   ( related term ) wildcats
   BT   ( broader term ) animals
   SN   ( scope note ) used only for domestic cats

domestic cats
   USE cats

wildcats
Concepts et libellés
cats
   UF ( used for ) domestic cats




skos: = http://www.w3.org/2004/02/skos/core#
rdf: = http://www.w3.org/1999/02/22-rdf-syntax-ns#
ex: = http://example.org/
Libellés multilingues
Relations sémantiques

cats
   RT ( related term ) wildcats
   BT ( broader term ) animals
Un graphe SKOS
animals
cats
     UF domestic cats
     RT wildcats
     BT animals
     SN used only for domestic cats
domestic cats
     USE cats
wildcats
Changement par rapport aux approches
             traditionelles

• Approche orientée concepts
• Plus de frontière “dure” entre vocabulaires
   Extension & alignement sont facilités à travers différents contextes
• L’utilisation de plusieurs vocabulaires dans une application
  est facilitée
• Transition vers une interoperabilité plus grande avec tous
  types de jeux de données
Extensions de SKOS
• MADS/RDF
   Autorités-matières (LCSH)
   France –– Histoire –– XXeme siècle
• ISO25964 (en cours)
   Thesaurus « classiques »
   – Coumpound equivalences:
   Charbonnages USE Charbon + Mines
   – Arrays:
   Chaises
     <Chaises par forme>
       Fauteuils
       …
SKOS vs. OWL – rappel
• Il y a vraiment une différence entre les deux approches
   Les ressources SKOS (les concepts) sont des instances de classes au sens
      de OWL (instances de skos:Concept). Elles-mêmes ne sont pas des
      classes par défaut.


• Des ontologies comme SKOS existent pour porter et exploiter
  sur le web de données des données sémantiques
  “traditionelles” sans avoir à la convertir (et les nettoyer) en
  ontologies OWL
Vocabulaires de valeurs

Terminologie du groupe LLD
  Regroupe vocabulaires contrôlés, vocabulaires d’autorités,
  mais aussi potentiellement des folksonomies…

SKOS est une ontologie qui permet de publier un semble de
  ressources d’autorité, référentiels provenant des
  bibliothèques ou bien d’autres domaines
http://www.w3.org/2001/sw/wiki/SKOS/Datasets
http://thedatahub.org/dataset?q=format-skos
http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Value_vocabularies
DBpedia, Freebase?
• Le web de données efface la fontière technique entre
  vocabulaire d’autorité et « simples » jeux de données
• Des ressources SKOS peuvent être liées à des ressources
  différentes
   Par ex. une personne et le « concept d’une personne » dans un fichier
     d’autorité
• Un jeu de données peut devenir un référentiel
Linked Library Data




http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/
Jeux de données
• Dans le domaine bibliographique
   – Catalogues de bibliothèques nationales
   – Services documentaires spécialisés
Jeux de données a réutiliser et lier

• Ressources d’intérêt bibliographique sur le Data Hub
                                    thedatahub.org/group/lld
• Linked Open Data Cloud sur le Data Hub
                                   thedatahub.org/group/lod
• Moteurs de recherche sur le Linked Data Cloud
                                                   Sindice.com
Merci !

aisaac@few.vu.nl




Remerciements particuliers:
• Equipe et partenaires Europeana
• Membres du groupe Library Linked Data

Mais conteúdo relacionado

Mais procurados

OpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesOpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesopenminted_eu
 
Europeana, la bibliothèque numérique européenne
Europeana, la bibliothèque numérique européenneEuropeana, la bibliothèque numérique européenne
Europeana, la bibliothèque numérique européenneUNITEC
 
La base de connaissance nationale BACON : construction, bilan, évolutions - B...
La base de connaissance nationale BACON : construction, bilan, évolutions - B...La base de connaissance nationale BACON : construction, bilan, évolutions - B...
La base de connaissance nationale BACON : construction, bilan, évolutions - B...ABES
 
Dématérialisation des supports et nouveaux usages en bibliothèques
Dématérialisation des supports et nouveaux usages en bibliothèquesDématérialisation des supports et nouveaux usages en bibliothèques
Dématérialisation des supports et nouveaux usages en bibliothèquesXavier Galaup
 
Open Data en Belgique
Open Data en BelgiqueOpen Data en Belgique
Open Data en BelgiqueBart Hanssens
 

Mais procurados (6)

OpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiquesOpenMinTeD - Une infrastructure text-mining au service des scientifiques
OpenMinTeD - Une infrastructure text-mining au service des scientifiques
 
Introduction à IIIF
Introduction à IIIFIntroduction à IIIF
Introduction à IIIF
 
Europeana, la bibliothèque numérique européenne
Europeana, la bibliothèque numérique européenneEuropeana, la bibliothèque numérique européenne
Europeana, la bibliothèque numérique européenne
 
La base de connaissance nationale BACON : construction, bilan, évolutions - B...
La base de connaissance nationale BACON : construction, bilan, évolutions - B...La base de connaissance nationale BACON : construction, bilan, évolutions - B...
La base de connaissance nationale BACON : construction, bilan, évolutions - B...
 
Dématérialisation des supports et nouveaux usages en bibliothèques
Dématérialisation des supports et nouveaux usages en bibliothèquesDématérialisation des supports et nouveaux usages en bibliothèques
Dématérialisation des supports et nouveaux usages en bibliothèques
 
Open Data en Belgique
Open Data en BelgiqueOpen Data en Belgique
Open Data en Belgique
 

Destaque

Destaque (20)

Maria josefa rosello, a y k
Maria josefa rosello, a y kMaria josefa rosello, a y k
Maria josefa rosello, a y k
 
SEGURIDAD Y CONTROL DE LOS SISTEMAS DE INFORMACIÓN
SEGURIDAD Y CONTROL DE LOS SISTEMAS DE INFORMACIÓNSEGURIDAD Y CONTROL DE LOS SISTEMAS DE INFORMACIÓN
SEGURIDAD Y CONTROL DE LOS SISTEMAS DE INFORMACIÓN
 
Looks lyceens
Looks lyceensLooks lyceens
Looks lyceens
 
Envoyez vos cartes de voeux avec EasyCards
Envoyez vos cartes de voeux avec EasyCardsEnvoyez vos cartes de voeux avec EasyCards
Envoyez vos cartes de voeux avec EasyCards
 
Think act
Think actThink act
Think act
 
4º basico b 07 de agosto
4º basico b  07 de agosto4º basico b  07 de agosto
4º basico b 07 de agosto
 
Présentation CSR
Présentation CSRPrésentation CSR
Présentation CSR
 
Aider un demandeur d'emploi soufrant de pathologie
Aider un demandeur d'emploi soufrant de pathologieAider un demandeur d'emploi soufrant de pathologie
Aider un demandeur d'emploi soufrant de pathologie
 
Entramados verticales
Entramados verticalesEntramados verticales
Entramados verticales
 
Facebook dangers et bons plans
Facebook dangers et bons plansFacebook dangers et bons plans
Facebook dangers et bons plans
 
La caída
La caídaLa caída
La caída
 
2°b
2°b2°b
2°b
 
Revolution consulatempire
Revolution consulatempireRevolution consulatempire
Revolution consulatempire
 
1. primer flash
1. primer flash1. primer flash
1. primer flash
 
Noisy
NoisyNoisy
Noisy
 
Torres nelli, laguna y fassina (santa maria jossefa rossello)
Torres nelli, laguna y fassina (santa maria jossefa rossello)Torres nelli, laguna y fassina (santa maria jossefa rossello)
Torres nelli, laguna y fassina (santa maria jossefa rossello)
 
Que contenido colocar en el blog
Que contenido colocar en el blogQue contenido colocar en el blog
Que contenido colocar en el blog
 
Empowerment numérique
Empowerment numériqueEmpowerment numérique
Empowerment numérique
 
Taller de tecnologia 2 trabajo final
Taller de tecnologia 2 trabajo finalTaller de tecnologia 2 trabajo final
Taller de tecnologia 2 trabajo final
 
Informativo n°39 -_6°_basico_a_-_12_de_diciembre_de_2014 -
Informativo n°39 -_6°_basico_a_-_12_de_diciembre_de_2014 -Informativo n°39 -_6°_basico_a_-_12_de_diciembre_de_2014 -
Informativo n°39 -_6°_basico_a_-_12_de_diciembre_de_2014 -
 

Semelhante a Séminaire Inria IST - Référentiels et interoperabilité (1)

Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Parc De Camargue
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesFleury Christine
 
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesInteropérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesPauline Moirez
 
Les protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialitésLes protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialitésEquipex Biblissima
 
Une introduction au web de données
Une introduction au web de donnéesUne introduction au web de données
Une introduction au web de donnéesYannick Prié
 
Bibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationBibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationFleury Christine
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesPierre Couchet
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeJulien Sicot
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationcatherine roussey
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02ABES
 
Collections numériques et recherche – quel arrimage ?
Collections numériques et recherche – quel arrimage ?Collections numériques et recherche – quel arrimage ?
Collections numériques et recherche – quel arrimage ?René Audet
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDAnonue12
 
L'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liéesL'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liéesGilbert Paquette
 
Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...
Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...
Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...Equipex Biblissima
 
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...Equipex Biblissima
 
04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdfAssociationAF
 

Semelhante a Séminaire Inria IST - Référentiels et interoperabilité (1) (20)

Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Adbs2012 presentation
Adbs2012 presentationAdbs2012 presentation
Adbs2012 presentation
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
 
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesInteropérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
 
Les protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialitésLes protocoles IIIF : présentation des potentialités
Les protocoles IIIF : présentation des potentialités
 
Une introduction au web de données
Une introduction au web de donnéesUne introduction au web de données
Une introduction au web de données
 
Bibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationBibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediation
 
IIIF et Biblissima
IIIF et BiblissimaIIIF et Biblissima
IIIF et Biblissima
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériques
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliotheque
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
 
Collections numériques et recherche – quel arrimage ?
Collections numériques et recherche – quel arrimage ?Collections numériques et recherche – quel arrimage ?
Collections numériques et recherche – quel arrimage ?
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDA
 
L'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liéesL'ingénierie des ENA fondée sur le web des données ouvertes et liées
L'ingénierie des ENA fondée sur le web des données ouvertes et liées
 
Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...
Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...
Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...
 
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
 
04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf04_RASAD_description_UX_MRestif.pdf
04_RASAD_description_UX_MRestif.pdf
 

Mais de Antoine Isaac

Addressing multilingual challenges at Europeana: An update - DCMI 2021
Addressing multilingual challenges at Europeana: An update - DCMI 2021Addressing multilingual challenges at Europeana: An update - DCMI 2021
Addressing multilingual challenges at Europeana: An update - DCMI 2021Antoine Isaac
 
Entity Management at Europeana - DCMI 2021
Entity Management at Europeana - DCMI 2021Entity Management at Europeana - DCMI 2021
Entity Management at Europeana - DCMI 2021Antoine Isaac
 
The Europeana Data Model Principles, community and innovation
The Europeana Data Model  Principles, community and innovationThe Europeana Data Model  Principles, community and innovation
The Europeana Data Model Principles, community and innovationAntoine Isaac
 
Europeana as a Linked Data (Quality) case
Europeana as a Linked Data (Quality) caseEuropeana as a Linked Data (Quality) case
Europeana as a Linked Data (Quality) caseAntoine Isaac
 
Metadata aggregation of IIIF Resources at Europeana: status and plans
Metadata aggregation of IIIF Resources at Europeana: status and plansMetadata aggregation of IIIF Resources at Europeana: status and plans
Metadata aggregation of IIIF Resources at Europeana: status and plansAntoine Isaac
 
IIIF and the Europeana mission
IIIF and the Europeana missionIIIF and the Europeana mission
IIIF and the Europeana missionAntoine Isaac
 
Multilingual challenges and ongoing work to tackle them at Europeana
Multilingual challenges and ongoing work to tackle them at EuropeanaMultilingual challenges and ongoing work to tackle them at Europeana
Multilingual challenges and ongoing work to tackle them at EuropeanaAntoine Isaac
 
Semantic Interoperability at Europeana - MultilingualDSIs2018
Semantic Interoperability at Europeana - MultilingualDSIs2018Semantic Interoperability at Europeana - MultilingualDSIs2018
Semantic Interoperability at Europeana - MultilingualDSIs2018Antoine Isaac
 
Lightweight rights modeling and linked data publication for online cultural h...
Lightweight rights modeling and linked data publication for online cultural h...Lightweight rights modeling and linked data publication for online cultural h...
Lightweight rights modeling and linked data publication for online cultural h...Antoine Isaac
 
Designing a multilingual knowledge graph - DCMI2018
Designing a multilingual knowledge graph - DCMI2018Designing a multilingual knowledge graph - DCMI2018
Designing a multilingual knowledge graph - DCMI2018Antoine Isaac
 
The Europeana Data Model - TPDL2018
The Europeana Data Model - TPDL2018The Europeana Data Model - TPDL2018
The Europeana Data Model - TPDL2018Antoine Isaac
 
Data scale and diversity issues at Europeana
Data scale and diversity issues at EuropeanaData scale and diversity issues at Europeana
Data scale and diversity issues at EuropeanaAntoine Isaac
 
Isaac - W3C Data on the Web Best Practices - Data Vocabularies
Isaac - W3C Data on the Web Best Practices - Data VocabulariesIsaac - W3C Data on the Web Best Practices - Data Vocabularies
Isaac - W3C Data on the Web Best Practices - Data VocabulariesAntoine Isaac
 
Enriching Cultural Heritage Data with DBpedia
Enriching Cultural Heritage Data with DBpediaEnriching Cultural Heritage Data with DBpedia
Enriching Cultural Heritage Data with DBpediaAntoine Isaac
 
Modelling and exchanging annotations
Modelling and exchanging annotationsModelling and exchanging annotations
Modelling and exchanging annotationsAntoine Isaac
 
EuropeanaTech update - Europeana AGM 2015
EuropeanaTech update - Europeana AGM 2015EuropeanaTech update - Europeana AGM 2015
EuropeanaTech update - Europeana AGM 2015Antoine Isaac
 
Modelling annotations for Europeana and related projects - DARIAH-EU WS
Modelling annotations for Europeana and related projects - DARIAH-EU WSModelling annotations for Europeana and related projects - DARIAH-EU WS
Modelling annotations for Europeana and related projects - DARIAH-EU WSAntoine Isaac
 
Classification schemes, thesauri and other Knowledge Organization Systems - a...
Classification schemes, thesauri and other Knowledge Organization Systems - a...Classification schemes, thesauri and other Knowledge Organization Systems - a...
Classification schemes, thesauri and other Knowledge Organization Systems - a...Antoine Isaac
 

Mais de Antoine Isaac (20)

Addressing multilingual challenges at Europeana: An update - DCMI 2021
Addressing multilingual challenges at Europeana: An update - DCMI 2021Addressing multilingual challenges at Europeana: An update - DCMI 2021
Addressing multilingual challenges at Europeana: An update - DCMI 2021
 
Entity Management at Europeana - DCMI 2021
Entity Management at Europeana - DCMI 2021Entity Management at Europeana - DCMI 2021
Entity Management at Europeana - DCMI 2021
 
The Europeana Data Model Principles, community and innovation
The Europeana Data Model  Principles, community and innovationThe Europeana Data Model  Principles, community and innovation
The Europeana Data Model Principles, community and innovation
 
Europeana as a Linked Data (Quality) case
Europeana as a Linked Data (Quality) caseEuropeana as a Linked Data (Quality) case
Europeana as a Linked Data (Quality) case
 
Metadata aggregation of IIIF Resources at Europeana: status and plans
Metadata aggregation of IIIF Resources at Europeana: status and plansMetadata aggregation of IIIF Resources at Europeana: status and plans
Metadata aggregation of IIIF Resources at Europeana: status and plans
 
IIIF and the Europeana mission
IIIF and the Europeana missionIIIF and the Europeana mission
IIIF and the Europeana mission
 
Multilingual challenges and ongoing work to tackle them at Europeana
Multilingual challenges and ongoing work to tackle them at EuropeanaMultilingual challenges and ongoing work to tackle them at Europeana
Multilingual challenges and ongoing work to tackle them at Europeana
 
Semantic Interoperability at Europeana - MultilingualDSIs2018
Semantic Interoperability at Europeana - MultilingualDSIs2018Semantic Interoperability at Europeana - MultilingualDSIs2018
Semantic Interoperability at Europeana - MultilingualDSIs2018
 
Lightweight rights modeling and linked data publication for online cultural h...
Lightweight rights modeling and linked data publication for online cultural h...Lightweight rights modeling and linked data publication for online cultural h...
Lightweight rights modeling and linked data publication for online cultural h...
 
Designing a multilingual knowledge graph - DCMI2018
Designing a multilingual knowledge graph - DCMI2018Designing a multilingual knowledge graph - DCMI2018
Designing a multilingual knowledge graph - DCMI2018
 
The Europeana Data Model - TPDL2018
The Europeana Data Model - TPDL2018The Europeana Data Model - TPDL2018
The Europeana Data Model - TPDL2018
 
Europeana et IIIF
Europeana et IIIFEuropeana et IIIF
Europeana et IIIF
 
Data scale and diversity issues at Europeana
Data scale and diversity issues at EuropeanaData scale and diversity issues at Europeana
Data scale and diversity issues at Europeana
 
Isaac - W3C Data on the Web Best Practices - Data Vocabularies
Isaac - W3C Data on the Web Best Practices - Data VocabulariesIsaac - W3C Data on the Web Best Practices - Data Vocabularies
Isaac - W3C Data on the Web Best Practices - Data Vocabularies
 
Europeana APIs
Europeana APIsEuropeana APIs
Europeana APIs
 
Enriching Cultural Heritage Data with DBpedia
Enriching Cultural Heritage Data with DBpediaEnriching Cultural Heritage Data with DBpedia
Enriching Cultural Heritage Data with DBpedia
 
Modelling and exchanging annotations
Modelling and exchanging annotationsModelling and exchanging annotations
Modelling and exchanging annotations
 
EuropeanaTech update - Europeana AGM 2015
EuropeanaTech update - Europeana AGM 2015EuropeanaTech update - Europeana AGM 2015
EuropeanaTech update - Europeana AGM 2015
 
Modelling annotations for Europeana and related projects - DARIAH-EU WS
Modelling annotations for Europeana and related projects - DARIAH-EU WSModelling annotations for Europeana and related projects - DARIAH-EU WS
Modelling annotations for Europeana and related projects - DARIAH-EU WS
 
Classification schemes, thesauri and other Knowledge Organization Systems - a...
Classification schemes, thesauri and other Knowledge Organization Systems - a...Classification schemes, thesauri and other Knowledge Organization Systems - a...
Classification schemes, thesauri and other Knowledge Organization Systems - a...
 

Séminaire Inria IST - Référentiels et interoperabilité (1)

  • 1. Référentiels et interoperabilité (1) Antoine Isaac Europeana & Vrije Universiteit Amsterdam Séminaire INRIA IST Carnac, 2 Octobre 2012
  • 2. Avertissement ! • Le web de données ne matérialise pas la notion de “référentiel” Tout comme le web “traditionel”: techniquement rien ne distingue un “site de référence” d’un autre • Mais il y a quand même des ressources qui peuvent prétendre au statut de référence pour une ou plusieurs communautés
  • 3. Catégories de référentiels possibles Inspiration: rapports du groupe d’incubation du W3C “Bibliothèques et web de données” • Élements de métadonnées • Vocabulaires de valeurs • Jeux de données http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/
  • 4. Des catégories pas forcément disjointes? “Ontologie” a pu être utilisé pour divers “référentiels sémantiques” [Smith 2001]
  • 5. Des catégories pas forcément disjointes? • Conceptuellement, elles expriment “de la sémantique” • Parfois un artefact appartient à deux catégories • Mais d’un point de vue technique (semantic web stack) il y a une vraie différence
  • 6. Eléments de métadonnées A.k.a ontologies OWL, metadata element sets • Fournissent les classes et propriétés qui servent de support à l’expression des descriptions • Types d’ontologies selon la portée ontologie noyau vs. ontologie de domaine vs. ontologie d’application
  • 7. “Briques de construction” des graphes RDF myMES:Article rdf:type http://example.org/article1 myMES:suject myVV:Amsterdam
  • 8. Ontologies par “popularité” sur le Linked Data Cloud http://www4.wiwiss.fu-berlin.de/lodcloud/state/#terms
  • 9. Dans l’inventaire Library Linked Data http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Metadata_Element_Sets
  • 10. Dublin Core DCMI Metadata Terms dublincore.org/ • A l’origine, 15 éléments généraux pour tous types de documents dc:title, dc:creator, dc:coverage, dc:subject • Spécialisés en éléments plus spécifiques, avec par ex. domaines et ranges dcterms:spatial, dcterms:creator dcterms:Agent • Utilisable pour relier des resources, pas seulement des descriptions “à plat” • Effort communautaire
  • 11. FOAF Friend of a Friend www.foaf-project.org/ • Décrire des personnes – réseaux sociaux, pages personnelles… • Porté par deux personnes, retour d’expérience des utilisateurs • Approche très pragmatique
  • 12. OAI-ORE www.openarchives.org/ore/ Open Archives Initiative - Object Reuse and Exchange • Décrire des aggrégations de resources qui composent des ressources numériques complexes • Eléments clefs – Aggrégation – Ressource aggrégée – “Proxy” – “Resource map” • Communauté OAI cf. OAI-PMH
  • 13. Bibo • Bibliographic Ontology bibliontology.com/ • Ontologie pour les ressources bibliographiques – Categorisation de documents (AcademicArticle) – Structure des documents (chapter…) – Citation (citedBy) • Créée par deux personnes
  • 14. FRBR • Modèle conceptuel développé par l’IFLA • Il existe plusieurs ontologies (FRBRer, FRBRcore, FRBRoo)
  • 15. Schema.org • Représenter dans les pages web des informations de base sur les objets qu’elle représentent Videos, Volcans, Sex shops… • Moteurs de recherche (Bing, Google, Yahoo!) • Approche top-down, mais très pragmatique
  • 16. Et bien d’autres… • CIDOC-CRM • W3C Media Ontology • Music Ontology …
  • 17. Où les trouver ? Rapports • Library Linked Data www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/ Moteurs de recherche • Sindice sindice.com • Watson watson.kmi.open.ac.uk/ Répertoires • Linked Open Vocabularies lov.okfn.org/dataset/lov/ • Open Metadata Registry metadataregistry.org
  • 19. Etude de cas : la création du Europeana Data Model http://pro.europeana.eu/edm-documentation
  • 20. ?
  • 21. Europeana Service qui donne accès aux objets numérisés du domaine patrimonial européen • Portail liés aux portails des institutions et projets partenaires europeana.eu • Services de données: – API pro.europeana.eu/api – Linked Data data.europeana.eu
  • 22. Qui envoie des données à Europeana? Horizontal Aggregators Vertical Aggregators Archives National Aggregators Culture Grid APEnet Libraries The European Library GLAMs Regional Aggregators “Dark” Aggregators Flanders museums ATHENA ELocal Film archives European Film Gateway Mn;kl;k;klj;lkj;lkj;jh;lkj;klj;klj; GLAMs Museums GLAMs klj;klj
  • 23. Qu’est-ce qui est envoyé à Europeana? 1. Thumbnails 2. Metadata 3. Links to digital objects online
  • 24. Résoudre un problème d’intégration de données Construire un service d’accès utilisant les métadonnées est difficile • Chaque domaine utilise ses propres modèles et formats LIDO, EAD… • Solution actuelle: les partenaires fournissent des métadonnées au format Europeana Semantic Elements (ESE) – Plus grand commun dénominateur pour les métadonnées – Données “à plat” – Ne respectent pas le “one-to-one principle” – Perte de la richesse des metadonnées orginelles
  • 25. Plus de “sémantique” pour l’accès aux objets Construire une “couche sémantique” au-dessus des objets
  • 26. Services assistés par la sémantique • Exploitation de relations comme: “localisé à”, “a pour sujet”, “concept plus générique”, correspondences entre langues, domaines – Reformulation de requêtes – Regroupement et personnalisation de résultats • Échanger des données plus riches • Les données plus riches sont souvent déjà là ! – Thesauri, classifications… – Éléments de données complexes (EAD, MARC) – Dans le domaine patrimonial ou ailleurs
  • 27. EDM design requirements Données plus fines • Distinction entre l’"objet fourni (tableau, livre…) et ses représentations numériques • Distinction entre l’objet et ses descriptions • Permettre plusieurs descriptions pour un objet Contenant éventuellement des assertions contradictoires • Représentation d’objets complexes • Ressources contextuelles, y compris concepts
  • 28. EDM design requirements Données plus interopérables • Permettre la co-existence de plusieurs grains de données Autoriser des profils spécifiques à un domaine • Réutiliser et étendre des éléments de standards existants
  • 29. EDM : les bases • OAI ORE pour l’organisation des metadonnées et des représentations numériques des objets • Dublin Core pour une partie des metadonnées descriptives • CIDOC-CRM comme inspiration pour la structure des événements et des relations entre objets • SKOS et d’autres référentiels pour les ressources contextuelles
  • 32. Aggregations OAI ORE organiser la “contribution” d’un partenaire provenance digital representation metadata aggregation object 32
  • 33. Proxys OAI ORE Représenter une “vue” sur les objets object metadata proxy 33
  • 34. Plusieurs fournisseurs = plusieurs aggregations DMF proxy DMF title The “real” painting Louvre Proxy Louvre title 34
  • 35. Europeana comme un “simple” fournisseur de metadonnées normalisées et enrichies Europeana aggregation 35 “enriched” metadata
  • 36. Entités contextuelles Récupér et exploiter des données “orginelles” ou enrichies réclame plus que des descriptions centrées objet Evénements, lieux, agents, concepts
  • 38. EDM est un effort collaboratif • Europeana v1.0 WP3: 60 participants • Développement semi-ouvert, “en aquarium” • Transversal – Experts des bibliothèques, archives et musées – Avec EDM, Europeana devient plus compatible avec les besoins de communautés spécifiques. Il est aussi possible de créer des “profils” d’EDM pour ces communautés
  • 39. Bénéfices de l’approche web de données pour la conception d’EDM • Vocabulaires à réutiliser • Approche flexible de la conception et la ré-utilisation de standards • Ontologies spécifiques co-existant avec les ontologies standards • Pas de contrainte sur le grain du modèle de données • Facilité technique de la connection et la publication des données • Vision qui appuie les stratégies Open Data
  • 40. Retour aux éléments de métadonnées – ou presque
  • 41. EDM Elément de (méta)données Concept d’un vocabulaire d’autorité 41
  • 42. SKOS Simple Knowledge Organization System Portée: knowledge organization systems (KOS) comme les thesauri, systèmes de classification, autorités matières… SKOS permet de représenter et d’échanger les KOS en RDF de manière simple
  • 43. Représenter la sémantique La manière formalisée: OWL Semantic Web ontology language Ontologies avec une sémantique exploitable par la machine • Mère est une classe • C’est l’intersection des classes Femme et Parent • Parent est la classe des ressources de type Personne qui sont liés à au moins une autre ressource de type Personne en utilisant la propriété estParentDe …
  • 44. SKOS n’est pas pour des ontologies formelles • Il est possible de produire des ontologies à partir de KOS, mais les KOS – Se concentrent souvent sur les données lexicales Enfant UtiliséPour Progéniture – Ont une sémantique plus “molle” Parent TermeLié Enfant – Sont parfois gigantesques et donc difficiles à “nettoyer” • Et pourtant en tant que tels les KOS peuvent être utiles à de nombreuses applications! Recherche sémantique, annotation…
  • 45. SKOS – les bases Pour satisfaire la majorité des besoins • Concepts • Propriétés lexicales • Liens sémantiques • Notes Sémantique et interopérabilité
  • 46. Un thesaurus fictif Animals cats UF ( used for ) domestic cats RT ( related term ) wildcats BT ( broader term ) animals SN ( scope note ) used only for domestic cats domestic cats USE cats wildcats
  • 47. Concepts et libellés cats UF ( used for ) domestic cats skos: = http://www.w3.org/2004/02/skos/core# rdf: = http://www.w3.org/1999/02/22-rdf-syntax-ns# ex: = http://example.org/
  • 49. Relations sémantiques cats RT ( related term ) wildcats BT ( broader term ) animals
  • 50. Un graphe SKOS animals cats UF domestic cats RT wildcats BT animals SN used only for domestic cats domestic cats USE cats wildcats
  • 51. Changement par rapport aux approches traditionelles • Approche orientée concepts • Plus de frontière “dure” entre vocabulaires Extension & alignement sont facilités à travers différents contextes • L’utilisation de plusieurs vocabulaires dans une application est facilitée • Transition vers une interoperabilité plus grande avec tous types de jeux de données
  • 52. Extensions de SKOS • MADS/RDF Autorités-matières (LCSH) France –– Histoire –– XXeme siècle • ISO25964 (en cours) Thesaurus « classiques » – Coumpound equivalences: Charbonnages USE Charbon + Mines – Arrays: Chaises <Chaises par forme> Fauteuils …
  • 53. SKOS vs. OWL – rappel • Il y a vraiment une différence entre les deux approches Les ressources SKOS (les concepts) sont des instances de classes au sens de OWL (instances de skos:Concept). Elles-mêmes ne sont pas des classes par défaut. • Des ontologies comme SKOS existent pour porter et exploiter sur le web de données des données sémantiques “traditionelles” sans avoir à la convertir (et les nettoyer) en ontologies OWL
  • 54. Vocabulaires de valeurs Terminologie du groupe LLD Regroupe vocabulaires contrôlés, vocabulaires d’autorités, mais aussi potentiellement des folksonomies… SKOS est une ontologie qui permet de publier un semble de ressources d’autorité, référentiels provenant des bibliothèques ou bien d’autres domaines
  • 58. DBpedia, Freebase? • Le web de données efface la fontière technique entre vocabulaire d’autorité et « simples » jeux de données • Des ressources SKOS peuvent être liées à des ressources différentes Par ex. une personne et le « concept d’une personne » dans un fichier d’autorité • Un jeu de données peut devenir un référentiel
  • 60. Jeux de données • Dans le domaine bibliographique – Catalogues de bibliothèques nationales – Services documentaires spécialisés
  • 61.
  • 62. Jeux de données a réutiliser et lier • Ressources d’intérêt bibliographique sur le Data Hub thedatahub.org/group/lld • Linked Open Data Cloud sur le Data Hub thedatahub.org/group/lod • Moteurs de recherche sur le Linked Data Cloud Sindice.com
  • 63. Merci ! aisaac@few.vu.nl Remerciements particuliers: • Equipe et partenaires Europeana • Membres du groupe Library Linked Data