Bibliothèques et musées sont des institutions de mémoire, ce qui les rapproche, mais ces institutions ont également des spécificités qui les distinguent : les collections muséales consistent essentiellement en objets uniques, tandis que les bibliothèques mettent l'accent sur la notion plus abstraite de publications dont de multiples établissements, voire un seul et même établissement, peuvent posséder des exemplaires réputés "identiques". Néanmoins, il y a suffisamment de points communs entre ces deux catégories d'institutions patrimoniales pour qu'il vaille la peine d'assurer l'interopérabilité des descriptions qu'elles produisent de leurs collections. Historiquement, toutefois, bibliothèques et musées ont d'abord développé séparément leurs propres modèles conceptuels, pour ne les faire converger qu'à partir de 2003. L'intervention présente les grands principes qui ont présidé au développement du CIDOC CRM, modèle conceptuel de l'information muséologique, et de FRBROO, extension du CIDOC CRM qui reformule le modèle FRBR de l'information bibliographique, et donne un très rapide tour d'horizon de quelques utilisations concrètes de ces deux modèles dans le domaine des humanités numériques.
Rompre avec la logique des silos : les protocoles IIIF pour l’interopérabilit...
Interopérabilité de l'information bibliographique et muséologique
1. Interopérabilité de
l’information bibliographique
et muséologique
Mégadonnées et interopérabilité
dans les humanités numériques
15 décembre 2015
MESHS-Lille
dans le cadre du projet
TECTONIQ (PEPS CNRS – Inter MSH, Université Lille 3)
Patrick Le Bœuf
Bibliothèque nationale de France
3. Musées et bibliothèques
apparentés…
… mais différents
objets uniques
essentiellement
exemplaires de publications
essentiellement
Pourquoi en rendre les descriptions interopérables ?
4. Musées et bibliothèques
différents…
… mais apparentés
aussi des objets non uniques aussi des objets uniques
… et des objets qui se répondent…
Comment en rendre les descriptions interopérables ?
5. 5
Modélisation conceptuelle
« Belle Marquise,
vos beaux yeux... »
Structure de
données A
« Yeux Marquise !
beaux, belle, vos... »
« Beaux, vos yeux ;
Marquise, belle… »
Structure de
données B
Structure de
données C
Formalisation des
concepts communs
6. Quelle coïncidence !
• 1998 : version
préliminaire du
modèle CIDOC CRM
par l’ICOM CIDOC
• 1997 : modèle FRBR
par l’IFLA
7. CIDOC CRM
(Conceptual Reference Model)
• Contexte organisationnel :
ICOM : Conseil international des musées
CIDOC : Comité international
pour la documentation
• Matériau de départ :
CIDOC Relational Data Model
• 430 entités en 1995 : devenu ingérable !
• pas assez flexible
CIDOC Information Categories
• liste des éléments de données communs
à 23 standards de description muséographique
7
8. La vision de Martin Doerr
Legacy
systems
Legacy
systems
Data
basesPhénomènes du monde
?
Conceptualisation
donne une
approximation de explique,
motive
organisent
Données sous diverses formes
Structures de données
et modèles de présentation
9. FRBR
(Functional Requirements for Bibliographic Records)
• Contexte organisationnel :
IFLA : Fédération internationale des
associations de bibliothécaires et de
bibliothèques
• Matériau de départ :
Pas de modèle préalable
Documents normatifs tels que ISBD
(International Standard Bibliographic
Description)
9
10. FRBR :
toute une famille de modèles
• 1998 : Functional Requirements for
Bibliographic Records, FRBR
• 2009 : Functional Requirements for
Authority Data, FRAD
• 2011 : Functional Requirements for
Subject Authority Data, FRSAD
• En cours : fusion des trois modèles,
FRBR-LRM (Library Reference Model)
11. Et si on se parlait ?
• 2003 :
mise sur pied d’un groupe de travail
sur l’harmonisation entre les modèles
CIDOC CRM et FRBR
• Principe : « traduire » FRBR
(entité-relation) en une extension
du CIDOC CRM (orienté objet)
• Résultat : FRBROO
11
13. 13
Structure centrale
du CIDOC CRM
E7 Activité
E39 Agent E28 Objet Conceptuel
E18 Chose Matérielle
E52 Laps de Temps E53 Lieu
E55 Type
E41Appellation
a pris part à a affecté
a occupé s’est déroulée dans
identifie
sert à catégoriser
E5 Événement
14. 14
Quelques notions
fondamentales
• E2 Entité Temporelle
• E4 Période
• E5 Événement
• E7 Activité
• Réunion de phénomènes formant un
ensemble cohérent dans l’espace et dans
le temps
• Introduit la notion de la participation de
personnes et de la présence de choses
• Introduit les notions d’intention et
d’influence
• Introduit la notion d’outils
• Tout ce qui se produit dans le temps
(événements ou états)
15. Exemple
• « L’artiste Théodore Géricault a peint son tableau Le Radeau
de la Méduse (INV4884) dans la ville de Paris en 1818-1819. »
15
E21 Personne
E41 Appellation
E55 Type
E41 Appellation
E65 Création
E12 Production
E38 Image
E35 Titre
E22 Objet Fabriqué
E42 IdentifiantE55 Type
E41 Appellation
E55 Type
E41 Appellation
E53 Lieu
E41 Appellation
E52 Laps de Temps
E50 Date
P1 est identifié par
P94 a créé
P102 a pour titre
P65 présente comme visuel
P48 a pour identifiant
préférentiel
P1 est identifié par
P7 a eu lieu dans
P1 est identifié par
P1 est identifié par
P78 est identifié par
= "Théodore Géricault"
= "artiste"
= "Le Radeau de la Méduse"
= "INV4884"
= "tableau"
= "Paris"= "ville"= "1818-1819"
E55 Type
P14.1 dans le rôle de
= "peintre"
16. La « famille CIDOC CRM »
16
CRMsci
CRM
CRMarcheo CRMdig
CRMinf
FRBRoo : données bibliographiques
PRESSoo : données sur les périodiques
CRMinf : modèle d’inférences
CRMsci : observations scientifiques
CRMgeo : modèle spatio-temporel
CRMarcheo : données archéologiques
CRMdig : métadonnées de provenance
19. FRBROO :
modéliser la notion de publication
F30 Publication
Event
P4 has time-span
F32 Carrier
Production Event
F19 Publication
Work
F24 Publication
Expression
F5 Item
E52 Time-Span
E50 Date
E52 Time-Span
E50 Date
P4 has time-span
P78 is identified by P78 is identified by
R3 is realised in
R6 carries
R24 created
R23 created a realisation of
R28 produced
20. Une extension à l’extension…
• FRBR insuffisant pour rendre compte de
la complexité des périodiques
• FRBROO ne résout pas ce problème
• 2013 : Centre international ISSN + BnF
développent PRESSOO
20
21. Démarche
d’élaboration de PRESSOO
• Matériau de départ :
Manuel de l’ISSN
expertise de spécialistes des périodiques
• Examen des éléments de données
requis par le Manuel de l’ISSN
traduction de leur sémantique
dans la structure de FRBROO
quand ça coince, déclaration
de nouvelles classes et propriétés
21
24. CIDOC CRM et ses « fils » :
des modèles adaptés aux techniques du Web sémantique ?
• OUI et NON à la fois
OUI :
• Structure Classe – propriété – Classe
très proche de celle des triplets RDF
NON :
• « Propriétés typées » difficiles à exprimer en RDF
• Difficultés pour implémenter dates imprécises
• Pas de préconisation pour traitement des chaînes
de caractères ou représentation des identifiants
• Modèles conceptuels abstraits
plutôt qu’ontologies « prêtes à l’usage »
25.
26.
27. Usages de FRBROO
• FRBROO conçu au départ pour la
communauté bibliothéconomique
(qui ne se l’est pas encore vraiment approprié)
• D’autres communautés y ont vu un potentiel
pour leur domaine, notamment dans les
humanités numériques :
HuCit
SAWS
Biblissima
…
27
28. HuCit
• Matteo Romanello (King’s College) : PhD sur la notion
de citations canoniques de textes de l’Antiquité :
comment reconnaître automatiquement
ces citations au sein d’une publication moderne ?
comment les traiter automatiquement
pour identifier le texte cité ?
comment s’en servir pour accéder directement
au texte identifié (hypertexte)
ou pour permettre des études sur l’intertextualité ?
• Avec Michele Pasin, développement de l’ontologie
Humanities Citation (HuCit) « qui vise à caractériser
la sémantique des citations telles qu’elles sont
normalement conçues et utilisées
dans les disciplines humanistes* »
28* : (Matteo Romanello, Michele Pasin,
An Ontological view of canonical citations, 2011)
29. HuCit et FRBROO
• HuCit développée comme une
extension de FRBROO, selon
les mêmes principes que PRESSOO
• Chaque nouvelle classe introduite
dans HuCit est une sous-classe
d’une classe de FRBROO ou du CIDOC CRM
• Idem pour les propriétés
• Pas de modèle préexistant :
matériau de base = l’analyse de Matteo Romanello
(son expertise, sa conceptualisation du domaine)
29
30.
31. SAWS
• Sharing Ancient WisdomS (SAWS)
Projet réunissant :
• le King’s College (Londres)
• l’institut Newman (Uppsala)
• et l’Université de Vienne
focus :
• étude des florilèges anciens
de propos et anecdotes (gnomologie)
• comme outil d’approche de l’épistémé
des sociétés qui les ont produits ;
• analyse de la complexité de ces matériaux
• et de leurs interactions
31
32. SAWS et techniques
du Web sémantique
• Besoin d’une ontologie
pour décrire les liens
entre textes distincts
• entre deux florilèges
• entre un florilège et les sources qu’il cite
et au sein d’un même texte
• Ces liens sont représentés
et stockés en RDF
32
33. SAWS et FRBROO
• Pour les mêmes raisons que HuCit,
l’ontologie SAWS s’est construite comme une
extension de FRBROO / CIDOC CRM
• Déclare des sous-classes très détaillées aux
classes de FRBROO / CIDOC CRM
• Permet une description très fine de la
structure (tant logique que matérielle)
d’un manuscrit médiéval
• Les triplets RDF sont intégrés
à l’encodage en TEI des florilèges édités
33
34. Biblissima
• Projet 2012-2019 visant à améliorer les outils
de recherche sur les manuscrits médiévaux,
notamment en utilisant les techniques du
Web sémantique
permettre l’interopérabilité entre des
bases de données existantes hétérogènes
via une ontologie s’appuyant sur FRBROO,
sur laquelle sera construit « l’observatoire
Biblissima »
• <http://bbf.enssib.fr/consulter/bbf-2013-05-0023-005>
34
35. Ontologie Biblissima
• Domaine :
modélisation de l’histoire de la transmission
des textes et de l’histoire des collections
• Type de questions auxquelles on espère
pouvoir répondre grâce à cette ontologie :
Combien de manuscrits à la feuille d’or
dans telle collection aujourd’hui dispersée ?
Quelles copies de tel texte sont enluminées ?
Combien de versions existe-t-il de tel texte ?
Quels sont les seuls fragments par lesquels
tel texte est parvenu jusqu’à nous ? Etc.
• <http://doc.biblissima-condorcet.fr/ontologie>
35