Présentation dans le cadre de la journée d'étude "Outils, méthodes, corpus : la modélisation des données en SHS" (17/11/2014 INHA, Paris), par Stefanie Gehrke (coordinatrice métadonnées Biblissima) et Matthieu Bonicel (BnF, coordinateur observatoire Biblissima)
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Biblissima et la modélisation de l’histoire de la transmission des textes et de la constitution des collections
1. Biblissima et la modélisation
de l’histoire de la
transmission des textes et de
la constitution des collections
Matthieu Bonicel, BnF, Coordinateur Observatoire Biblissima
Stefanie Gehrke, Coordinatrice Métadonnées Biblissima
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
Biblissima bénéficie d’une aide de l'Etat gérée par l'ANR au titre du programme Investissements d'avenir (ANR-11-EQPX-0007)
2. Grandes lignes :
● CORPUS
● OUTILS
● METHODES
o Modélisation de l’histoire de la
transmission des textes
o Modélisation de la constitution des
collections
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
3. Corpus
Manuscrits :
BnF Archives et Manuscrits, Medium,
Bibale, Pinakes, Jonas, Librairie de
Charles V et Charles VI, Initiale,
Mandragore, Manuscripta Medica,
Europeana Regia
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
6. Corpus
Inventaires :
Bibliotheca bibliothecarum de Montfaucon
Bibliothèque du Mont Saint-Michel
Sanderus electronicus, Rabelais Forse
Catalogues de la Sorbonne
Catalogues de vente
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
7. Corpus
Reliures :
Reliures
BSG sur la reliure médiévale et moderne
Transmission :
Miroir des classiques
Traditio Hollandrini
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
8. Outils I
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
GINCO
(thesaurus termes techniques -
concepts en SKOS)
baseX
(référentiels lieux, personnes, collectivités,
oeuvres (+expressions et manifestation
singletons ?) - données en TEI)
Mirador
(images ; manifests en JSON-LD)
?
(affichage des données)
openRefine
(alignement des autorités)
Editeur XML
XXE
triplestore ou
quad store
9. Pour EAD, TEI, CSV,
RDF, SKOS, SQL et images
Donnera accès via
HTML
SPARQL endpoint
visualiseur IIIF
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
Outils II
10. METHODES
● Réutilisation de standards existants
● Utilisation d’un cadre RDF pour arriver à
l’interopérabilité de 50 bases
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
11. METHODES
● Capitaliser sur les résultats de projets
précédents comme Europeana Regia
● Établir de bonnes pratiques en terme de
projets numériques sur l’histoire des
collections et la transmission de textes
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
14. METHODES
Obstacles à la fin d’Europeana Regia lors du
passage ESE -> EDM (RDF) :
● besoin d’URIs pour les collections et
possesseurs (dcterms:isPartOf, dc:provenance)
● besoin d’URIs pour les manuscrits
(edm:physicalThing)
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
15. Constitution des collections et histoire
de la transmission des textes
● Portail biblissima permettra faire des
requêtes sur :
o collections et possesseurs
o contenu d’une collection
o vie d’une collection, vie d’un livre
o copie, traduction, décoration, diffusion,
rédaction etc. d’une oeuvre textuelle
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
16. Constitution des collections et histoire
de la transmission des textes
● Portail permettra de visualiser les
résultats sous forme de listes, de cartes
et de frises chronologiques
● et la circulation matérielle des documents
=> accent sur l’évènement
=> choix de CIDOC CRM et FRBRoo
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
17. RDF pour Biblissima - Manuscrits -
exemple “Medium”
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
bibma:Manuscript
18. RDF pour Biblissima - Manuscrits -
exemple “Medium”
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
bibma:Manuscript
E42_Identifier
P48_has_preferred_identifier
P2_has_type
E55_Type
bibma:Record
P70i_is_documented_in
E35_Title
P102_has_title
19. RDF pour Biblissima - Manuscrits –
exemple “Medium”
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
bibma:Manuscript
E42_Identifier
P48_has_preferred_identifier
P2_has_type
E55_Type
P45_consists_of
bibma:Record
P70i_is_documented_in
E57_Material
E35_Title
P102_has_title
E39_Actor
P50_has_current_keeper
20. RDF pour Biblissima - Manuscrits -
exemple “Medium”
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
bibma:Manuscript
E42_Identifier
P48_has_preferred_identifier
F28_Expression_Creation
P108i_was_produced_by
P2_has_type
E55_Type
F22_Self-
Contained_Expression
P45_consists_of
bibma:Record
P70i_is_documented_in
E57_Material
P128_carries
E35_Title
P102_has_title
R17_created
?
E39_Actor
P50_has_current_keeper
21. RDF pour Biblissima - Manuscrits -
exemple “Medium” (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/49049"/>
<ecrm:P2_has_type rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<ecrm:P50_has_current_keeper rdf:resource="http://data.bnf.fr/ark:/12148/cb11885481g"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
22. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/49049"/>
<ecrm:P2_has_type rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<ecrm:P50_has_current_keeper rdf:resource="http://data.bnf.fr/ark:/12148/cb11885481g"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
classe de l’ontologie
Biblissima
23. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about=http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049>
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
<rdf:Description rdf:about="http://biblissima-condorcet.fr/id/Identifier/Medium/49049">
<rdf:value>France, Paris, Bibliothèque Mazarine, ms. 1292</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E42_Identifier"/>
</rdf:Description>
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b">
<rdf:type rdf:resource="http://purl.org/NET/bibma#Record"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
24. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
<rdf:Description rdf:about="http://biblissima-condorcet.fr/id/Identifier/Medium/49049">
<rdf:value>France, Paris, Bibliothèque Mazarine, ms. 1292</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E42_Identifier"/>
</rdf:Description>
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b">
<rdf:type rdf:resource="http://purl.org/NET/bibma#Record"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
URL Notice
Medium
25. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
<rdf:Description rdf:about="http://biblissima-condorcet.fr/id/Identifier/Medium/49049">
<rdf:value>France, Paris, Bibliothèque Mazarine, ms. 1292</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E42_Identifier"/>
</rdf:Description>
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b">
<rdf:type rdf:resource="http://purl.org/NET/bibma#Record"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
termes thesaurus
Biblissima
URL Notice
Medium
26. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://biblissima-condorcet.fr/ark:43093/id/Expression/Medium/49049">
<efrbroo:R17i_was_created_by rdf:resource=”http://biblissima-condorcet.fr/id/ExpressionCreation/Medium/49049”>
<rdf:type rdf:resource="http://erlangen-crm.org/efrbroo/F22_Self-Contained_Expression"/>
</rdf:Description>
<rdf:Description rdf:about="http://biblissima-condorcet.fr/id/ExpressionCreation/Medium/49049">
<efrbroo:R17_created rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/49049"/>
<ecrm:P4_has_time-span rdf:resource=”http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/13_s"/>
<rdf:type rdf:resource="http://erlangen-crm.org/efrbroo/F28_Expression_Creation"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
évènement
termes thesaurus
Biblissima
27. CIDOC CRM + FRBRoo :
Transmission des textes
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
F28_Expression_Creation F22_Self-Contained_Expression
E52_Time-Span
E50_Date
E53_Place
E44_Place_Appellation
E56_Language
E39_Actor
R17_created
F22_Self-Contained_Expression
E56_Language
P4_has-time_span
P14_carried_out_by
F28_Expression_Creation
R17_created
F1_Work
R19_created_a_realisation_of
P72_has_language
P72_has_language
F27_Work_Conception
E39_Actor
P7_took_place_at P73_has_translation
bibma:Manuscript
bibma:Manuscript
R3_is_realised_in
E39_Actor
28. Chaque manuscrit son expression ?
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
F28_Expression_Creation
F22_Self-Contained_Expression
bibma:Manuscript
P108i_was_produced_by
R17_created
P128_carries
E35_Title
P102_has_title
P102_has_title
E50_Date
E53_Place
F1_Work
R3_is_realised_in
E35_Title
E35_Title
E52_Time-Span
E44_Place_Appellation
E39_Actor
R19_created_a_realisation_of
29. Plusieurs manuscrits par expression ?
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
F28_Expression_Creation
F22_Self-Contained_Expression
bibma:Manuscript
F1_Work
E53_Place
E12_Production (Copy Event)
E53_Place
E39_Actor (Scribe)
P108_has_produced
P12_occurred_in_the_presence_of
R17_created
R19_created_a_realisation_of
P14_carried_out_by
E52_Time-Span
E52_Time-Span
P128_carries
R3_is_realised_in
30. Obstacle : Titre - URI
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
F1_Work E35_Title
F28_Expression
(1)
F28_Expression
(2)
bibma:Manuscript
P102_has_title
E35_Title
E35_Title
E35_Title Definition ?
Definition ?
Definition ?
Definition ?
P102_has_title
P102_has_title
P102_has_title
“auteur, titre. langue (type)”
“auteur (xxxx-xxxx), titre”
a) titre d’expression ?
b) nom d’usage (+ Cote ?)
31. CIDOC CRM + FRBRoo :
Constitution des collections
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E78_Collection
E8_Acquisition
bibma:Manuscript
bibma:Manuscript
bibma:Manuscript
bibma:Print
bibma:Print
E35_Title
E39_Actor
E53_Place
E6_Destruction
E80_Part_Removal
bibma:Inventory
E79_Part_AdditionE87_Curation_Activity
P46_is_composed_of
P70_documents
P102_has_title
E50_Date
P109_has_current_or_former_curator
P53_has_former_or_
current_location
E12_Production
32. CIDOC CRM + FRBRoo :
Inventaires + catalogues de ventes
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E31_Document
bibma:Manuscript
P70_documents
E78_Collection
owl:sameAs
bibma:Manuscript
E8_Acquisition
P23_transferred_title_from
E39_Actor E39_Actor
P24_transferred_title_of
P22_transferred_title_to
bibma:Item ?
bibma:Subdivison ?
P106_is_composed_of
P106_is_composed_of
P70_documents
E12_Production
P108_has_produced
bibma:Sales_Catalogue
33. CIDOC CRM + FRBRoo :
Inventaires + catalogues de ventes
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
bibma:Item ? bibma:Manuscript
P70_documents
E13_Attribute_Assignement
P141_assigned
E42_Identifier
P48_has_preferred_
identifier
P140_assigned_attribute_to
E39_Actor
P14_carried_out_by
Avranches,
Bibliothèque
municipale, 161
Chercheur MRSH
Caen
Inventaire de
Montfaucon
34. But du projet Biblissima
● production de données (2013-2016)
● transmission des textes / collections
● les rendre accessibles via UN portail
● faciliter la recherche sur ces données
● visualisation des résultats
● soutenir des outils, répertoires et projets
du domaine des humanités numériques
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
35. En cours
● ADHO SIG Libraries and DH Proposal
● Prototype Initiale Mandragore
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
36. ADHO SIG “Libraries and DH”
Planning : envoyer une proposition fin de l’année
But : “advocate for initiatives of interest and benefit to
both libraries and digital humanities ;
organizing conference sessions - ones for librarians at DH
conferences, and others focused on DH at conferences
intended primarily for librarians”
>130 collègues ont déjà signalé leur intérêt
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
37. Prototype Initiale - Mandragore
● valoriser le potentiel des données de
Biblissima
● jeu de données en RDF
● descripteurs géographiques
● compatible avec le CIDOC CRM + FRBRoo
● http://doc.biblissima-condorcet.fr/retour-
dexperience-biblissima-lutilisation-de-cidoc-crm
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
Notas do Editor
= copie du texte par exemple la copie de la traduction de Rufin : ne créée pas une nouvelle expression de l’oeuvre. on n’utilise donc pas l’évènement F28_Expression_Creation mais l’évènement E12_Production.
ça va être difficile et prendre du temps de réaliser des transformations différentes selon les cas (copies ou nouvelles expressions) ainsi que de gérer les URIs.