SlideShare uma empresa Scribd logo
1 de 69
1
PÉRENNISATION ET COMMUNICATION DE
L’INFORMATION NUMÉRIQUE
2-6 FÉVRIER 2015
Les métadonnées de
pérennisation et l’accès aux
objets
2
PASCAL ROMAIN
Département général de la Gironde
Interface
SOMMAIRE
3
Numérique et pratiques archivistiques
Quelle organisation mettre en place ?
Pourquoi les metadonnées ?
Comment favoriser l’accès numérique au patrimoine culturel ?
Le grand saut numérique
4
Valorisation des savoir-faire des
professionnels de l’information
5
Levier pour un meilleur pilotage des politiques publiques
Des métiers (archiviste, record manager, documentaliste, bibliothécaire)
avec des compétences et des réflexions sur :
●
●
La qualité de l'information et la provenance des données et documents


Leur cycle de vie


Les référentiels structurés


Les identifiants


À la convergence des politiques liées aux données publiques,

à leur diffusion (ouverture) et à leur conservation (sécurité)
Contribution a la prise en compte des
enjeux stratégiques
6
Maintien de la valeur
probante des données
et des documents
numériques
Contribution a la prise en compte des
enjeux stratégiques
7
Problématique de la
pérennisation :
l’obsolescence des
formats des données
Contribution a la prise en compte des
enjeux stratégiques
8
Protection des données à
caractère personnel
Équilibre entre devoir de
mémoire et droit à l’oubli
Feuille de route du ministère de
la culture pour le web 3.0
9
 Action 1 Mettre en place un dispositif d’identifiants pérennes pour les
ressources culturelles
 Action 2 Développer un dispositif d'identification des auteurs de
ressources culturelles
 Action 3 Créer et maintenir une interconnexion sémantique des grands
référentiels culturels
 Le « Graphe Culture »
 Action 4 Expérimenter l’interconnexion inter-institutionnelle des données
culturelles
 Action 5 Explorer des modes d’interaction avec les publics utilisant les
potentialités du Web 3.0
 Action 6 Mettre en place un dispositif global de R&D destiné au soutien
de l’innovation du Web 3.0 culturel
 Action 7 Appliquer les technologies 3.0 à la description des événements
culturels
 Action 8 Positionner le Ministère de la Culture et de la Communication
en tant qu’expert sur la traçabilité des données numériques
 Action 9 Mettre en place un programme de sensibilisation et de
formation interne pour le Ministère de la Culture et de la Communication
Sommaire
10
Numérique et pratiques archivistiques
Quelle organisation mettre en place ?
Pourquoi les metadonnées ?
Comment favoriser l’accès numérique au patrimoine culturel ?
système d’information ouvert d’archivage
OAIS : un modèle conceptuel organisé autour de six entités
gérant les échanges d’informations au sein du système
d’information
11
12
Gestion du flux et du stock
Crédit : Françoise Banat-Berger,
SIAF
Organisation physique et logique
13
ENJEUX D’INGÉNIÉRIE ET D’INGÉNIOSITÉ
14
Organisation
La gestion et le stockage
impliquent la description
d’événements (l’analyse,
l’enrichissement, le stockage, la
migration) dont la responsabilité
incombe à différentes entités
OAIS.
Ces processus sont complexes et
nécessitent la description
des objets à conserver et à
diffuser
Le modèle d’information de l’OAIS :
le contexte de la gestion (ou archivage)
15
L’administration dans le temps
de l’objet archive nécessite le
suivi et la conservation des
événements qui affectent
l’information.
Une veille technologique est
nécessaire pour garantir l’accès
des agents habilités au cours du
cycle de vie des objets
informationnels et la
conservation du capital
informationnel.
Le modèle d’information de l’OAIS :
le contexte d’administration
16
L’accès aux informations
nécessite l’enrichissement et la
mise en relation des objets
avec d’autres sources
d’explicitation .
Les communautés d’agents
expriment des besoins qui
doivent être pris en compte
sans compromettre l’intégrité
de l’entité OAIS.
Le modèle d’information de l’OAIS :
le contexte de l’accès
17
Sommaire
18
 Numérique et pratiques archivistiques
 Quelle organisation mettre en place ?
 Pourquoi les metadonnées ?
 Comment favoriser l’accès numérique au patrimoine culturel ?
Introduction sur les métadonnées : définition
Une métadonnée est une donnée
servant à définir ou décrire une
autre donnée. Porteuse
d'information sur le contexte, le
sens et la finalité de la ressource
informationnelle portée par la donnée
brute.
μετά:
préfixe grec
indiquant l'auto-
référence
19
Introduction sur les métadonnées : cas
pratique
20
+ =
titre
contexte temporel
contexte spatial
producteur
indexation sujet
indexation lieu
Introduction sur les métadonnées : dispositifs
21
Dans le contexte numérique, des
dispositifs de médiation sont
nécessaires à l’appréhension de la
donnée.
Plusieurs communautés d’utilisateurs
impliquent différents types de
métadonnées
Une métadonnée doit avoir une finalité
et une utilité immédiate
Des dispositifs de stockage, de
sécurisation
et de surveillance sont nécessaires à la
conservation des données
Attention : l’abus de métadonnées est dangereux pour la santé
Des dispositifs
d’encodage, de
lecture
et de transmission
conditionnent
notre accès aux
données
Introduction sur les métadonnées : la
carte d’identité technique
Les en-têtes des fichiers
numériques sont
porteurs d’information
d’identification et de
provenance
22
Introduction sur les métadonnées : les enjeux
La structuration de
l’information est
La clé qui assure la
versatilité des usages qui
peuvent être capitalisés à
partir d’un processus de
description
23
L’entité OAIS utilise les
métadonnées pour
normaliser et structurer les
échanges d’informations
avec les acteurs externes
et internes
L’objectif est de conserver
la richesse de l’information
et sa traçabilité
Le modèle d’information de l’OAIS :
la structuration des métadonnées
24
métadonnées
administratives
métadonnées
descriptives
métadonnées
de structure
Introduction sur les métadonnées :
structuration
25
métadonnées
techniques
métadonnées
administratives
métadonnées
descriptives
métadonnées
de structure
Conservation des informations
sur le processus de création
et de transformation
Traçabilité des échanges
et des habilitations
Intelligibilité du contexte
Pérennisation et interopérabilité
Le modèle d’information de l’OAIS :
les paquets d’information
26
Paquet Information
Objet
Le modèle d’information de l’OAIS :
les paquets d’information : l’information
27
l’Objet Information est
composé d’un objet données
(physique ou numérique) et
de l’information de
représentation qui
permettent d’interpréter les
données
sous la forme d’une
information compréhensible.
Le modèle d’information de l’OAIS :
les paquets d’information : la représentation
28
• Information de structure
l
types de données courants en
informatique, comme des caractères, des
nombres, des pixels, des tableaux
• Information sémantique
l
informations complémentaires associées
aux éléments de structure, telles que la
langue dans laquelle l’objet est exprimé,
les opérations réalisables sur chaque type
de données et leurs relations, etc.
• Autres
l
Identifiants d’autres standards comme la
référence à la norme ASCII
basé sur le principe de la
récursivité
Le modèle d’information de l’OAIS :
les paquets d’information : la pérennisation
29
Information de provenance
Décrit l’origine du contenu d’information, qui en a la charge, et quel est
l’historique de ses modifications
• Information de contexte
• Décrit comment le contenu d’information s’articule avec d’autres
informations à l’extérieur du paquet
• Information d’identification
• Fournit un ou plusieurs identifiants ou systèmes d’identification
• Information de droits d’accès
• (Access Rights Information) : information qui identifie les restrictions
d’accès portant sur l’Information de contenu
• Information d’intégrité
• Protège le contenu d’information contre les altérations non
documentées
Informatio
n
d'accès
Le modèle conceptuel nous
aide à considérer
l’objet information dans un
cycle de vie non-linéaire
Le modèle d’information de l’OAIS :
les paquets d’information
30
Le modèle d’information de l’OAIS :
les relations
31
Une information est toujours produite dans un contexte.
Elle résulte de l’action d’un ou plusieurs agents.
Son cycle de vie est une suite d’événements qui opèrent
sur des objets entre lesquels il existe souvent des relations
Du concept à l’application
pratique :
l’ivresse du choix
encoder et lier les métadonnées:
pratique
32
Encoder et lier les métadonnées: modèles
métiers v/s modèles interopérales
33
EAD PREMIS MIX
Dublin Core EXIF
Unimarc PROV-O ESE
METS Vcard FOAF
MODS SKOS DCAT
SEDA
Quelle structuration ?
Quelles finalités ?
Encoder et lier les métadonnées:
pratique
34
Les schémas de
métadonnées servent à
contrôler la saisie et
développer la sémantique
des informations
Encoder et lier les métadonnées: modèles
conceptuels
35
Ontologie: défini de manière formelle, pour un domaine de connaissance, les concepts qui
permettront de décrire les « choses » de façon non ambiguë, et les règles contraignant ces
descriptions
Cette norme comprend les éléments suivants :
- les types de choses : classes
Ex : Document, Livre, Personne
- les propriétés ou attributs des choses
Ex : auteur, date de publication
- les contraintes éventuelles qui relient celles-ci à celles-là
Ex : Un livre est un document, un livre a au moins un auteur, une personne n'est pas un document
Encoder et lier les métadonnées: le
web de données : ontologies et vocabulaires
36
Syntaxe :
<scheme:chaîne/de.caractère>
<http://monsite.com/dossier/fichier.html#ancre>
<http://mondomaine.org/ressource/1234>
• un préfixe qui indique le contexte dans lequel
l’identifiant est attribué (par ex. http:,ftp:, urn:,
etc.)
• un élément qui permet de désigner l’autorité
nommante qui a attribué l’identifiant au sein de
ce système
• le « nom » lui-même, c'est-à-dire une chaîne de
caractères qui identifie la ressource de manière
unique, au sein de ce système et pour cette
autorité.
LES URI SONT DES IDENTIFIANTS WEB.
LES URL SONT DES URI QUI IDENTIFIENT LA
RESSOURCE PAR LE MOYEN D'Y
ACCÉDER.
LES URL PEUVENT ÊTRE PÉRENNES.
http://fr.wikipedia.org/wiki/Universal_Unique_Identifier
Encoder et lier les métadonnées: uri
(uniform resource identifier) : l’économie durable de la
connaissance
37
Encoder et lier les métadonnées
RDF : la structuration de l’accès aux ressources
Le sujet est toujours une URI.
Toute “chose” sur laquelle on veut faire des assertions
(sujet) doit avoir une URI.
Les “choses” ont toujours un type : une CLASSE.
sujet
prédicat
Le prédicat est toujours une URI.
Il permet d'exprimer les propriétés des
“choses”, ou les relations des “choses” entre elles
objet
L‘objet peut être un texte (littéral) ou une URI.
Les classes et les propriétés sont déclarées dans des vocabulaires pour être réutilisées
Le modèle RDF permet de décloisonner les silos de données.
Les référentiels permettent alors de les relier
L’Écume des jours est un roman de Boris Vian publié en 1947
avec pour thèmes centraux l’amour, la maladie, la mort
L’Écume des jours est un roman
L’Écume des jours a pour auteur Boris Vian
L’Écume des jours est paru en 1947
L’Écume des jours a pour thèmes l’amour, la maladie, la mort
J’irais cracher sur vos tombes a pour auteur Vernon Sullivan
L’Écume des jours– type - roman
L’Écume des jours– auteur - Boris Vian
L’Écume des jours– année de parution – 1947
L’Écume des jours - thème – amour
http://dbpedia.org/page/Froth_on_the_Daydream
http://data.bnf.fr/13091689/boris_vian/
dbpedia:Froth_on_the_Daydream rdf:type
yago:Novel106367879
dbpedia:Froth_on_the_Daydream dcterms:creator
dbpedia:Boris_Vian
dbpedia:Froth_on_the_Daydream dcterms:date "1947"
dbpedia:Froth_on_the_Daydream skos:subject dbpedia:Love
dbpedia-owl:wikiPageRedirects dcterms:creator
dbpedia:Vernon_Sullivan
encoder et lier les métadonnées : Rdf,
le hub des données
39
SKOS est construit sur la base du langage RDF,
et son principal objectif est de permettre la
publication facile de vocabulaires structurés
pour leur utilisation dans le cadre du Web de
données.
les propriétés de mise en correspondance
proposées dans SKOS permettent d'exprimer
des correspondances entre concepts
provenant de schémas différents
l
skos:exactMatch ou skos:closeMatch
l
skos:broadMatch, skos:narrowMatch,
skos:relatedMatch
l
skos:semanticRelation
Encoder et lier les métadonnées: skos
(simple knowledge organisation system) le
thésaurus à l’heure du web
40
http://data.culture.fr/thesaurus/resource/ark:/67717/T1-1302
dct:created "2014-03-12T19:13:55+0100" ;
dct:modified "2012-11-22T00:00:00+0100" ;
iso-thes:status "1" ;
a skos:Concept ;
skos:exactMatch <http://data.bnf.fr/ark:/12148/cb13318807v> ;
skos:historyNote "2011-12-07 : modification du prefLabel
« Education" en « Education et sciences""@fr-fr ;
skos:inScheme <http://data.culture.fr/thesaurus/resource/ark:/67717/Matiere> ;
skos:narrower <http://data.culture.fr/thesaurus/resource/ark:/67717/T1-1121> ,
<http://data.culture.fr/thesaurus/resource/ark:/67717/T1-3> ,
<http://data.culture.fr/thesaurus/resource/ark:/67717/T1-499> ,
<http://data.culture.fr/thesaurus/resource/ark:/67717/T1-881> ;
skos:prefLabel « Education et sciences"@fr-fr ;
<http://www.w3.org/2008/05/skos-xl#prefLabel>
<http://data.culture.fr/thesaurus/resource/ark:/67717/ce918de4-581a-49a6-83ef-d8932deb73d6> ;
foaf:focus <http://dbpedia.org/resource/Education> .
Encoder et lier les métadonnées: skos
(simple knowledge organisation system) le
thésaurus à l’heure du web
41
Encoder et lier les métadonnées : skos
(simple knowledge organisation system) le
thésaurus à l’heure du web
42
langage à balises permettant de structurer et
de décrire un ensemble d’objet au sein
d’espace de noms
• langage hiérarchique permettant de
décrire des relations
• langage de transport d’information
permettant de standardiser les échanges de
données
• peut être décrit par un schéma ou une DTD
• peut servir au stockage des données mais
également à leur interrogation
<xml version="1.0" encoding="UTF-8"?>
<ex:collection xml:lang="fr"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns=http://www.w3.org/1999/xhtml
xmlns:ex="http://exemple.org">
<ex:vehicule>
<dc:title>Mon super vélo</dc:title>
<velo id="2">
<taille>76</taille>
<marque>cool bike</marque>
<modele>speeder</modele>
</ex:velo>
<ex:velo taille="76" marque="coolbike"
modele="speeder" id="2" />
Encoder et lier les métadonnées:
xml (extensible markup language) : la lingua franca de
l’encodage d'information
43
Il est souvent nécessaire
d’expliciter l’information
en décrivant son
contexte et ses relations
Encoder et lier les métadonnées: la
description du contexte
44
Au départ le
monde selon EAD
Encoder et lier les métadonnées:
construction d’une ontologie
45
Les objets à modéliser
HTTP://ARCHIVESHUB.AC.
UK/LOCAH/
Encoder et lier les métadonnées:
identifier les concepts
46
Les relations entre
concepts
Encoder et lier les métadonnées:
identifier les relations
47
Et hop une ontologie !
http://data.archiveshub.ac.uk/
Réutilisant des vocabulaires existants
RDF Schema (RDFS): http://www.w3.org/2000/01/rdf-
schema#
Dublin Core Terms: http://purl.org/dc/terms/
Friend of a Friend (FOAF): http://xmlns.com/foaf/0.1/
Simple Knowledge Organisation System (SKOS):
http://www.w3.org/2004/02/skos/core#
Object Reuse & Exchange (ORE):
http://www.openarchives.org/ore/terms/
Vocabulaire biographique :
http://purl.org/vocab/bio/0.1/
Event Ontologie: http://purl.org/NET/c4dm/event.owl#
Linked Open Data Events vocabulary (LODE):
http://linkedevents.org/ontology/
Timeline Ontologie:
http://purl.org/NET/c4dm/timeline.owl#
Encoder et lier les métadonnées: en
route pour les usages
48
Encoder et lier les métadonnées
prov-o : les métadonnées de provenance :
modèle générique
Le schéma ci-contre représente les
trois principales entités du modèle
PROV-O ainsi que les relations
qu'elles peuvent avoir les unes
avec les autres.
49
Entity (Entité)
Dans le modèle PROV, une entité est une ressource dont on veut décrire la provenance.
« Une entité est un objet physique, numérique, conceptuel ou tout autre type d’objet avec des aspects déterminés ;
les entités peuvent être réelles ou imaginaires. »
Par exemple : un document, une partie d'un document, une idée, un article de nouvelles, un contrat, un résultat, etc.
Activity (Activité)
Les activités sont les processus qui ont utilisé ou généré des entités, comme par exemple : calculer un résultat,
écrire un livre, faire une présentation. Les activités ne sont pas des entités.
« Une activité est quelque chose qui se produit pendant une période déterminée et qui agit sur ou avec des entités ;
elle peut inclure l’utilisation, la transformation, la modification, la délocalisation, ou la génération d’entités. »
Agent (Agent)
Les agents sont responsables des activités affectant les entités.
Un agent est quelque chose qui porte une forme de responsabilité dans le déroulement d'une activité, dans l’existence
d’une entité ou dans l’activité d’un autre agent.
Ce peut être une personne, une composante de logiciel, un objet inanimé, une organisation, ou une autre entité.
Encoder et lier les métadonnées
prov-o les métadonnées de provenance :
modèle générique
50
Les entités, les activités et les agents peuvent interagir les unes par rapport aux
autres :
• d'un point de vue temporel :
• une Entité a été générée (wasGeneratedBy) par une Activité ;
• une Activité a utilisé (used) une Entité ;
• une Activité a été fondée (wasInformedBy) sur une autre Activité ;
• une Entité est dérivée (wasDerivedFrom) d'une autre Entité ;
• une Activité a commencé (startedAtTime) à une Date/heure donnée ;
• une Activité s'est terminée (endedAtTime) à une Date/heure donnée.
• du point de vue de la responsabilité :
• une Activité a été associée (wasAssociatedWith) à un Agent ;
• une Entité a été attribuée (wasAttributedTo) à un Agent ;
• un Agent a agi pour le compte (actedOnBehalfOf) d'un autre Agent.
Encoder et lier les métadonnées
prov-o : les métadonnées de provenance
Les interactions
51
Generation (Génération)
Les activités génèrent de nouvelles entités. La génération permet de décrire l'origine des entités et
de répondre à des questions, comme par exemple : comment un document a-t-il été généré ?
Comment un résultat de calcul a-t-il été obtenu ? Comment une entité a-t-elle été modifiée ?
Comment un résultat a-t-il été validé ?
 
Usage (Utilisation)
Les activités utilisent également des entités. L'utilisation permet de préciser quelles sont les entités
qui ont participé à une activité, par exemple : les références utilisées pour créer un document, la
requête faite pour obtenir un résultat ou encore les flux entrants d'un processus informatique.
 
Communication (Communication)
La communication sert à décrire l'interdépendance entre deux activités. Quelles sont les activités qui
ont précédé l’activité actuelle ? Quelles sont les étapes nécessaires pour exécuter une requête ?
 Attribution (Attribution)
L'attribution est l'assignation d'une activité à un agent.
Elle permet de répondre à des questions comme par exemple : qui est l'auteur d'un document particulier ?
Quel logiciel a été utilisé pour générer tel résultat ? Qui a créé tel jeu de données ?
Encoder et lier les métadonnées
prov-o : les métadonnées de provenance
Les typages des relations
52
Derivation (Dérivation)
Les activités utilisent et génèrent des entités.
Dans certains cas, l'utilisation d'une entité a une influence sur la création d'une autre entité.
Cette « influence » ou dérivation est la transformation d'une entité en une autre entité,
le résultat de la mise à jour d'une entité
est la génération d'une nouvelle entité à partir de l'entité préexistante.
La dérivation permet de décrire l'interdépendance
de différentes entités entre elles.
Par exemple : les contenus d’un document s’appuient-ils sur d’autres entités ?
Quelles ressources ont influencé cette entité et dans quelle mesure ?
 
Association (Association)
Un agent peut se voir attribuer une certaine responsabilité dans le déroulement d'une activité.
D’après le modèle PROV, l'Activité est associée à l'Agent.
La relation d'association permet de répondre à des questions comme par exemple :
qui a la responsabilité d'un document ?
Qui a la responsabilité de l'élaboration d'un produit/contrat ?
 
Delegation (Délégation)
La délégation est l'assignation d'une autorité et d'une responsabilité à un agent
(par lui-même ou par un autre agent) pour exercer une activité spécifique comme délégué ou représentant,
tandis que l'agent pour le compte duquel il agit détient une certaine responsabilité
dans le résultat du travail qui a fait l'objet de la délégation.
La délégation sert à préciser les responsabilités de plusieurs agents les uns par
rapport aux autres. Par exemple : quel utilisateur a activé tel outil pour générer tel rapport ?
encoder et lier les métadonnées
prov-o : les métadonnées de provenance
Les typages des relations
53
Le modèle étendu est une
extension des principaux concepts
de PROV-O. Le schéma ci-dessous
présente les concepts
supplémentaires permettant de
décrire plus finement la
provenance.
Encoder et lier les métadonnées
prov-o : les métadonnées de provenance :
modèle générique
54
Le schéma SEDA permet de décrire les relations
entre les acteurs au cours des échanges (transfert, de
communication, de modification, d'élimination ou de
restitution d’archives).
•
• Il permet d'automatiser les procédures
d'échange d'information en décrivant les règles
contractuelles qui régissent le versement et la
prise en charge d'un paquet d'information.
•
• Les messages SEDA décrivent les contraintes
(format, support, identification) et fournissent un
historique des opérations effectuées (transfert,
réception, destruction, etc..)
•
• La grammaire XML permet de définir des règles
formelles vérifiables par les machines (est égal à, ne
peut pas être différent de, n'existe qu'en un seul
exemplaire, provient de, etc...)
Encoder et lier les métadonnées
seda: schéma d’échange des données
d’archivage
55
• Le schéma MEDONA Z 44-022 permet de
structurer les métadonnées générées par
les acteurs au cours des échanges
(transfert, de communication, de
modification, d'élimination ou de
restitution d’archives).
• Il doit permettre de modéliser les
échanges de données pour l‘archivage
et d'automatiser les procédures
d'échange d'information en décrivant les
règles contractuelles qui régissent le
versement et la prise en charge d'un
paquet d'information.
Les messages MEDONA décrivent les
contraintes (format, support, identification)
et fournissent un historique des opérations
effectuées (transfert, réception,
destruction, etc..)
•
• La grammaire XML permet de définir des
règles formelles vérifiables par les
machines (est égal à, ne peut pas être
différent de, n'existe qu'en un seul
exemplaire, provient de, etc...)
Encoder et lier les métadonnées
medona: structurer les métadonnées des
documents d’activité
56
• La classe ManagementMetadata
regroupe l'ensemble des informations
nécessaires à la gestion de l'échange
d'un paquet de données. Les informations
apportées par cette classe concernent
tous les Objets de données du
paquet.
Ces informations sont :
• l'accord de service (ArchivalAgreement),
• le profil d'archivage (ArchivalProfile),
• le niveau de service (ServiceLevel),
• la règle d'accessibilité (AccessRule)
• la règle pour le calcul du sort final
(AppraisalRule).
Toutes ces informations sont facultatives.
Encoder et lier les métadonnées
medona: structurer les métadonnées des
documents d’activité
57
Encoder et lier les métadonnées
medona: structurer les métadonnées des échanges
Tous les messages partagent des propriétés communes
définies dans la classe Message.
Ces propriétés sont :
• une date (Date) qui correspond à la date d'émission
du message
• un identifiant du message (MessageIdentifier) ;
• éventuellement des commentaires (Comment) qui
permettent en particulier d'expliquer la raison du
message (par exemple pour une réponse négative,
ces commentaires peuvent expliquer la raison du
refus et ce qu'il convient de faire pour reformuler la
demande)
• éventuellement une signature du message lui-même
(Signature).
Le message d'accusé de réception
(Ackwowledgement) hérite des propriétés de la classe
Message auxquelles il
faut ajouter l'identifiant du message dont il accuse la
réception.
58
Encoder et lier les métadonnées
medona: extension aux besoins d’une communauté
Une communauté peut créer son
propre schéma XML dérivé celui de la
norme sans avoir à intervenir sur le
schéma de la norme en incluant le
schéma de la norme dans le sien tout
en redéfinissant sous forme de
restriction les types laissés ouverts:
DescriptiveMetadataType,
OrganizationDescriptiveMetadataType
SignatureType
AccessRuleType)
Par exemple, si cette communauté
souhaite utiliser le modèle EAC-CPF 19)
pour décrire les acteurs (Service
versant, Service producteur, etc.), elle
donnera une autre définition du type
OrganizationDescriptiveMetadataType
dans son schéma dérivé. De cette
manière les messages qui respectent ce
nouveau schéma respectent forcément
le schéma de la norme.
<xsd:schema targetNamespace="org:afnor:www:medona:v1.0"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:medona="org:afnor:www:medona:v1.0"
xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:eac="urn:isbn:1-931666-33-4">
<xsd:import namespace="urn:isbn:1-931666-33-4" schemaLocation="cpf.xsd"/>
<xsd:import namespace="http://www.w3.org/1999/xlink" schemaLocation="xlink.xsd"/>
<xsd:redefine schemaLocation="MEDONA.xsd">
<xsd:complexType name="OrganizationDescriptiveMetadataType">
<xsd:complexContent>
<xsd:restriction base="medona:OrganizationDescriptiveMetadataType">
<xsd:sequence>
<xsd:element ref="eac:cpfDescription"/>
</xsd:sequence>
<xsd:attribute ref="xlink:href" use="prohibited"/>
</xsd:restriction>
</xsd:complexContent>
</xsd:complexType>
</xsd:redefine>
</xsd:schema>
59
Encoder et lier les métadonnées
dublin core: ppdc et interopérabilité
• permet l'interopérabilité entre des
données d'un domaine ou entre des
domaines hétérogènes (Plus Petit
Dénominateur Commun)
• 15 éléments optionnels répétables et
qualifiables
• profils d’implémentation permettant
d’échanger facilement des données
entre différents domaine
• permet de s’intégrer dans des portails
documentaires transversaux
• permet de gérer les descriptions
hétérogènes au sein d’une archive OAIS
60
SOMMAIRE
61
Numérique et pratiques archivistiques
Quelle organisation mettre en place ?
Pourquoi les metadonnées ?
Comment favoriser l’accès numérique au patrimoine culturel ?
6 verbes pour un échange de données
normalisé
qui?: la carte d'identité de l'entrepôt
quand?: les dates de modification
comment?:
les standards de métadonnées xml
les collection de données
combien?:
la liste des identifiants uniques
la liste des fiches descriptives
quoi?: le contenu de la fiche
descriptive
Notice d'identité Notice descriptive humainobjet numérique
entrepôts
moissonneurs
agrégateur
portail
Contenu culturel
l’accès à l’information par les métadonnées : oai-
pmh un protocole d’échange ouvert
62
l’accès à l’information par les métadonnées
a quoi ça sert ?
construire un espace global d’information
63
l’accès à l’information par les métadonnées
a quoi ça sert ?
favoriser le rebond
64
l’accès à l’information par les métadonnées
a quoi ça sert ?
favoriser la sérendipité
65
l’accès à l’information par les métadonnées
a quoi ça sert ?
augmenter l’expérience de l’usager
66
L’accès à l’information par les métadonnées
a quoi ça sert ?
valoriser les ressources patrimoniales
67
RÉFÉRENCES
• Édition ouverte : http://fr.slideshare.net/btsmultimedia/planchenmipdf?next_slideshow=1
• Feuille de route ministère de la culture : http://bit.ly/mccWeb3
• Exploration du rdf : http://en.lodlive.it/?http://dbpedia.org/resource/Boris_Vian
Culture clic : http://youtu.be/ARi03GxVvZY
 Publications:
Coyle, Karen, Understanding the Semantic Web: Bibliographic Data and Metadata. Library Technology Reports, Janvier 2010
Séminaire INRIA, Métadonnées: mutations et perspectives, ADBS, 2008
Crédits:
Aurélien Couraux, Gautier Poupeau, Emmanuelle Bermès, Ivan Herman, Fabien Gandron : présentations sur le web
illustrations: jlmaral, widdowquinn, wiccked, Fenng(dbanotes), LaChan, Laughing Squid, LZdR, woicik CC BY-NC 2.0
Liens :
SEDA: http://www.archivesdefrance.culture.gouv.fr/seda/
MODS http://www.loc.gov/standards/mods/
Dublin Core http://dublincore.org/
SKOS http://www.w3.org/TR/skos-reference/
METS http://loc.gov/METS
RDF http://www.W3C.org/RDF
OWL2 http://www.W3C/OWL2
ARK https://confluence.ucop.edu/display/Curation/ARK
OAI-PMH http://www.openarchives.org/OAI/openarchivesprotocol.html
Contact: p.romain@cg33.fr twitter: @keronos
68
69
 Contact :
École nationale des chartes
service de la formation continue
65, rue de Richelieu - 75002 Paris
T. +33 (0)1 55 42 21 53
et
19, rue de la Sorbonne - 75005 Paris
T. +33 (0)1 55 42 88 78
formation.continue@enc.sorbonne.fr

Mais conteúdo relacionado

Destaque

L’implantation d’un système de gestion documentaire
L’implantation d’un système de gestion documentaireL’implantation d’un système de gestion documentaire
L’implantation d’un système de gestion documentaireDidier Labonte
 
Diaporama GED-SAE
Diaporama GED-SAEDiaporama GED-SAE
Diaporama GED-SAEinforoutes
 
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...Baba Kourouma
 
100527 Gestion électronique des documents
100527 Gestion électronique des documents100527 Gestion électronique des documents
100527 Gestion électronique des documentsCOMPETITIC
 
Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...
Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...
Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...Christian Dubourg
 
Bonnes pratiques pour un projet de GED
Bonnes pratiques pour un projet de GEDBonnes pratiques pour un projet de GED
Bonnes pratiques pour un projet de GEDNuxeo
 
Une approche du Knowledge management
Une approche du Knowledge managementUne approche du Knowledge management
Une approche du Knowledge managementIsabelle GUYOT
 

Destaque (10)

L’implantation d’un système de gestion documentaire
L’implantation d’un système de gestion documentaireL’implantation d’un système de gestion documentaire
L’implantation d’un système de gestion documentaire
 
Diaporama GED-SAE
Diaporama GED-SAEDiaporama GED-SAE
Diaporama GED-SAE
 
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
Conduire un projet de GED: Concepts de base, points de repère pour la mise en...
 
100527 Gestion électronique des documents
100527 Gestion électronique des documents100527 Gestion électronique des documents
100527 Gestion électronique des documents
 
Système d'Archivage Electronique de l'Oise
Système d'Archivage Electronique de l'OiseSystème d'Archivage Electronique de l'Oise
Système d'Archivage Electronique de l'Oise
 
Tout savoir sur le SAE du Cdg60
Tout savoir sur le SAE du Cdg60Tout savoir sur le SAE du Cdg60
Tout savoir sur le SAE du Cdg60
 
Ged
Ged Ged
Ged
 
Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...
Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...
Certifier son système d’archivage marque NF 461, le plus dur est de s’y mettr...
 
Bonnes pratiques pour un projet de GED
Bonnes pratiques pour un projet de GEDBonnes pratiques pour un projet de GED
Bonnes pratiques pour un projet de GED
 
Une approche du Knowledge management
Une approche du Knowledge managementUne approche du Knowledge management
Une approche du Knowledge management
 

Semelhante a préservation de l'information numérique formation 2015

Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Gilbert Paquette
 
Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.Amar LAKEL, PhD
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Les métadonnées culturelles
Les métadonnées culturellesLes métadonnées culturelles
Les métadonnées culturellesElsa ComDigitale
 
Approches méthodologique d’analyse du web : en finir avec la division quali ...
Approches méthodologique d’analyse du web :  en finir avec la division quali ...Approches méthodologique d’analyse du web :  en finir avec la division quali ...
Approches méthodologique d’analyse du web : en finir avec la division quali ...Amar LAKEL, PhD
 
Renseignement et information
Renseignement et informationRenseignement et information
Renseignement et informationNicolae Sfetcu
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifiquelazoumi ouarfli
 
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaJean-Robert Bisaillon
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesDesconnets Jean-Christophe
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersEmmanuelle Morlock
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsolivier
 
Votre "data" je vous la sers comment ?
Votre "data" je vous la sers comment ?Votre "data" je vous la sers comment ?
Votre "data" je vous la sers comment ?dcotte
 
Portails d'information
Portails d'informationPortails d'information
Portails d'informationSKennel
 
Antonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de donnéesAntonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de donnéesBodyspacesociety Blog
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueGautier Poupeau
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Gautier Poupeau
 
Démarche documentaire Par Dr. Hassan El Ouazzani
Démarche documentaire  Par Dr. Hassan El OuazzaniDémarche documentaire  Par Dr. Hassan El Ouazzani
Démarche documentaire Par Dr. Hassan El OuazzaniElmahdi FRID
 
ENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard PuimattoENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard PuimattoDocumentation Rouen
 

Semelhante a préservation de l'information numérique formation 2015 (20)

Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
 
Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.Amar Lakel - Patrimonialisation numérique et avenir digital du document.
Amar Lakel - Patrimonialisation numérique et avenir digital du document.
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Les métadonnées culturelles
Les métadonnées culturellesLes métadonnées culturelles
Les métadonnées culturelles
 
Approches méthodologique d’analyse du web : en finir avec la division quali ...
Approches méthodologique d’analyse du web :  en finir avec la division quali ...Approches méthodologique d’analyse du web :  en finir avec la division quali ...
Approches méthodologique d’analyse du web : en finir avec la division quali ...
 
CULTURES DES DONNEES, CULTURES DE L’INFORMATION: Enjeux pour humanisme numéri...
CULTURES DES DONNEES, CULTURES DE L’INFORMATION: Enjeux pour humanisme numéri...CULTURES DES DONNEES, CULTURES DE L’INFORMATION: Enjeux pour humanisme numéri...
CULTURES DES DONNEES, CULTURES DE L’INFORMATION: Enjeux pour humanisme numéri...
 
Renseignement et information
Renseignement et informationRenseignement et information
Renseignement et information
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
 
Votre "data" je vous la sers comment ?
Votre "data" je vous la sers comment ?Votre "data" je vous la sers comment ?
Votre "data" je vous la sers comment ?
 
Portails d'information
Portails d'informationPortails d'information
Portails d'information
 
Antonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de donnéesAntonio CASILLI - Régimes de production des visualisations de données
Antonio CASILLI - Régimes de production des visualisations de données
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
 
Démarche documentaire Par Dr. Hassan El Ouazzani
Démarche documentaire  Par Dr. Hassan El OuazzaniDémarche documentaire  Par Dr. Hassan El Ouazzani
Démarche documentaire Par Dr. Hassan El Ouazzani
 
ENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard PuimattoENT et documentation Contextes, risques, opportunités. Gérard Puimatto
ENT et documentation Contextes, risques, opportunités. Gérard Puimatto
 

préservation de l'information numérique formation 2015

  • 1. 1 PÉRENNISATION ET COMMUNICATION DE L’INFORMATION NUMÉRIQUE 2-6 FÉVRIER 2015
  • 2. Les métadonnées de pérennisation et l’accès aux objets 2 PASCAL ROMAIN Département général de la Gironde Interface
  • 3. SOMMAIRE 3 Numérique et pratiques archivistiques Quelle organisation mettre en place ? Pourquoi les metadonnées ? Comment favoriser l’accès numérique au patrimoine culturel ?
  • 4. Le grand saut numérique 4
  • 5. Valorisation des savoir-faire des professionnels de l’information 5 Levier pour un meilleur pilotage des politiques publiques Des métiers (archiviste, record manager, documentaliste, bibliothécaire) avec des compétences et des réflexions sur : ● ● La qualité de l'information et la provenance des données et documents   Leur cycle de vie   Les référentiels structurés   Les identifiants   À la convergence des politiques liées aux données publiques,  à leur diffusion (ouverture) et à leur conservation (sécurité)
  • 6. Contribution a la prise en compte des enjeux stratégiques 6 Maintien de la valeur probante des données et des documents numériques
  • 7. Contribution a la prise en compte des enjeux stratégiques 7 Problématique de la pérennisation : l’obsolescence des formats des données
  • 8. Contribution a la prise en compte des enjeux stratégiques 8 Protection des données à caractère personnel Équilibre entre devoir de mémoire et droit à l’oubli
  • 9. Feuille de route du ministère de la culture pour le web 3.0 9  Action 1 Mettre en place un dispositif d’identifiants pérennes pour les ressources culturelles  Action 2 Développer un dispositif d'identification des auteurs de ressources culturelles  Action 3 Créer et maintenir une interconnexion sémantique des grands référentiels culturels  Le « Graphe Culture »  Action 4 Expérimenter l’interconnexion inter-institutionnelle des données culturelles  Action 5 Explorer des modes d’interaction avec les publics utilisant les potentialités du Web 3.0  Action 6 Mettre en place un dispositif global de R&D destiné au soutien de l’innovation du Web 3.0 culturel  Action 7 Appliquer les technologies 3.0 à la description des événements culturels  Action 8 Positionner le Ministère de la Culture et de la Communication en tant qu’expert sur la traçabilité des données numériques  Action 9 Mettre en place un programme de sensibilisation et de formation interne pour le Ministère de la Culture et de la Communication
  • 10. Sommaire 10 Numérique et pratiques archivistiques Quelle organisation mettre en place ? Pourquoi les metadonnées ? Comment favoriser l’accès numérique au patrimoine culturel ?
  • 11. système d’information ouvert d’archivage OAIS : un modèle conceptuel organisé autour de six entités gérant les échanges d’informations au sein du système d’information 11
  • 12. 12 Gestion du flux et du stock Crédit : Françoise Banat-Berger, SIAF
  • 13. Organisation physique et logique 13 ENJEUX D’INGÉNIÉRIE ET D’INGÉNIOSITÉ
  • 15. La gestion et le stockage impliquent la description d’événements (l’analyse, l’enrichissement, le stockage, la migration) dont la responsabilité incombe à différentes entités OAIS. Ces processus sont complexes et nécessitent la description des objets à conserver et à diffuser Le modèle d’information de l’OAIS : le contexte de la gestion (ou archivage) 15
  • 16. L’administration dans le temps de l’objet archive nécessite le suivi et la conservation des événements qui affectent l’information. Une veille technologique est nécessaire pour garantir l’accès des agents habilités au cours du cycle de vie des objets informationnels et la conservation du capital informationnel. Le modèle d’information de l’OAIS : le contexte d’administration 16
  • 17. L’accès aux informations nécessite l’enrichissement et la mise en relation des objets avec d’autres sources d’explicitation . Les communautés d’agents expriment des besoins qui doivent être pris en compte sans compromettre l’intégrité de l’entité OAIS. Le modèle d’information de l’OAIS : le contexte de l’accès 17
  • 18. Sommaire 18  Numérique et pratiques archivistiques  Quelle organisation mettre en place ?  Pourquoi les metadonnées ?  Comment favoriser l’accès numérique au patrimoine culturel ?
  • 19. Introduction sur les métadonnées : définition Une métadonnée est une donnée servant à définir ou décrire une autre donnée. Porteuse d'information sur le contexte, le sens et la finalité de la ressource informationnelle portée par la donnée brute. μετά: préfixe grec indiquant l'auto- référence 19
  • 20. Introduction sur les métadonnées : cas pratique 20 + = titre contexte temporel contexte spatial producteur indexation sujet indexation lieu
  • 21. Introduction sur les métadonnées : dispositifs 21 Dans le contexte numérique, des dispositifs de médiation sont nécessaires à l’appréhension de la donnée. Plusieurs communautés d’utilisateurs impliquent différents types de métadonnées Une métadonnée doit avoir une finalité et une utilité immédiate Des dispositifs de stockage, de sécurisation et de surveillance sont nécessaires à la conservation des données Attention : l’abus de métadonnées est dangereux pour la santé Des dispositifs d’encodage, de lecture et de transmission conditionnent notre accès aux données
  • 22. Introduction sur les métadonnées : la carte d’identité technique Les en-têtes des fichiers numériques sont porteurs d’information d’identification et de provenance 22
  • 23. Introduction sur les métadonnées : les enjeux La structuration de l’information est La clé qui assure la versatilité des usages qui peuvent être capitalisés à partir d’un processus de description 23
  • 24. L’entité OAIS utilise les métadonnées pour normaliser et structurer les échanges d’informations avec les acteurs externes et internes L’objectif est de conserver la richesse de l’information et sa traçabilité Le modèle d’information de l’OAIS : la structuration des métadonnées 24
  • 25. métadonnées administratives métadonnées descriptives métadonnées de structure Introduction sur les métadonnées : structuration 25 métadonnées techniques métadonnées administratives métadonnées descriptives métadonnées de structure Conservation des informations sur le processus de création et de transformation Traçabilité des échanges et des habilitations Intelligibilité du contexte Pérennisation et interopérabilité
  • 26. Le modèle d’information de l’OAIS : les paquets d’information 26 Paquet Information Objet
  • 27. Le modèle d’information de l’OAIS : les paquets d’information : l’information 27 l’Objet Information est composé d’un objet données (physique ou numérique) et de l’information de représentation qui permettent d’interpréter les données sous la forme d’une information compréhensible.
  • 28. Le modèle d’information de l’OAIS : les paquets d’information : la représentation 28 • Information de structure l types de données courants en informatique, comme des caractères, des nombres, des pixels, des tableaux • Information sémantique l informations complémentaires associées aux éléments de structure, telles que la langue dans laquelle l’objet est exprimé, les opérations réalisables sur chaque type de données et leurs relations, etc. • Autres l Identifiants d’autres standards comme la référence à la norme ASCII basé sur le principe de la récursivité
  • 29. Le modèle d’information de l’OAIS : les paquets d’information : la pérennisation 29 Information de provenance Décrit l’origine du contenu d’information, qui en a la charge, et quel est l’historique de ses modifications • Information de contexte • Décrit comment le contenu d’information s’articule avec d’autres informations à l’extérieur du paquet • Information d’identification • Fournit un ou plusieurs identifiants ou systèmes d’identification • Information de droits d’accès • (Access Rights Information) : information qui identifie les restrictions d’accès portant sur l’Information de contenu • Information d’intégrité • Protège le contenu d’information contre les altérations non documentées Informatio n d'accès
  • 30. Le modèle conceptuel nous aide à considérer l’objet information dans un cycle de vie non-linéaire Le modèle d’information de l’OAIS : les paquets d’information 30
  • 31. Le modèle d’information de l’OAIS : les relations 31 Une information est toujours produite dans un contexte. Elle résulte de l’action d’un ou plusieurs agents. Son cycle de vie est une suite d’événements qui opèrent sur des objets entre lesquels il existe souvent des relations
  • 32. Du concept à l’application pratique : l’ivresse du choix encoder et lier les métadonnées: pratique 32
  • 33. Encoder et lier les métadonnées: modèles métiers v/s modèles interopérales 33 EAD PREMIS MIX Dublin Core EXIF Unimarc PROV-O ESE METS Vcard FOAF MODS SKOS DCAT SEDA
  • 34. Quelle structuration ? Quelles finalités ? Encoder et lier les métadonnées: pratique 34
  • 35. Les schémas de métadonnées servent à contrôler la saisie et développer la sémantique des informations Encoder et lier les métadonnées: modèles conceptuels 35
  • 36. Ontologie: défini de manière formelle, pour un domaine de connaissance, les concepts qui permettront de décrire les « choses » de façon non ambiguë, et les règles contraignant ces descriptions Cette norme comprend les éléments suivants : - les types de choses : classes Ex : Document, Livre, Personne - les propriétés ou attributs des choses Ex : auteur, date de publication - les contraintes éventuelles qui relient celles-ci à celles-là Ex : Un livre est un document, un livre a au moins un auteur, une personne n'est pas un document Encoder et lier les métadonnées: le web de données : ontologies et vocabulaires 36
  • 37. Syntaxe : <scheme:chaîne/de.caractère> <http://monsite.com/dossier/fichier.html#ancre> <http://mondomaine.org/ressource/1234> • un préfixe qui indique le contexte dans lequel l’identifiant est attribué (par ex. http:,ftp:, urn:, etc.) • un élément qui permet de désigner l’autorité nommante qui a attribué l’identifiant au sein de ce système • le « nom » lui-même, c'est-à-dire une chaîne de caractères qui identifie la ressource de manière unique, au sein de ce système et pour cette autorité. LES URI SONT DES IDENTIFIANTS WEB. LES URL SONT DES URI QUI IDENTIFIENT LA RESSOURCE PAR LE MOYEN D'Y ACCÉDER. LES URL PEUVENT ÊTRE PÉRENNES. http://fr.wikipedia.org/wiki/Universal_Unique_Identifier Encoder et lier les métadonnées: uri (uniform resource identifier) : l’économie durable de la connaissance 37
  • 38. Encoder et lier les métadonnées RDF : la structuration de l’accès aux ressources Le sujet est toujours une URI. Toute “chose” sur laquelle on veut faire des assertions (sujet) doit avoir une URI. Les “choses” ont toujours un type : une CLASSE. sujet prédicat Le prédicat est toujours une URI. Il permet d'exprimer les propriétés des “choses”, ou les relations des “choses” entre elles objet L‘objet peut être un texte (littéral) ou une URI. Les classes et les propriétés sont déclarées dans des vocabulaires pour être réutilisées
  • 39. Le modèle RDF permet de décloisonner les silos de données. Les référentiels permettent alors de les relier L’Écume des jours est un roman de Boris Vian publié en 1947 avec pour thèmes centraux l’amour, la maladie, la mort L’Écume des jours est un roman L’Écume des jours a pour auteur Boris Vian L’Écume des jours est paru en 1947 L’Écume des jours a pour thèmes l’amour, la maladie, la mort J’irais cracher sur vos tombes a pour auteur Vernon Sullivan L’Écume des jours– type - roman L’Écume des jours– auteur - Boris Vian L’Écume des jours– année de parution – 1947 L’Écume des jours - thème – amour http://dbpedia.org/page/Froth_on_the_Daydream http://data.bnf.fr/13091689/boris_vian/ dbpedia:Froth_on_the_Daydream rdf:type yago:Novel106367879 dbpedia:Froth_on_the_Daydream dcterms:creator dbpedia:Boris_Vian dbpedia:Froth_on_the_Daydream dcterms:date "1947" dbpedia:Froth_on_the_Daydream skos:subject dbpedia:Love dbpedia-owl:wikiPageRedirects dcterms:creator dbpedia:Vernon_Sullivan encoder et lier les métadonnées : Rdf, le hub des données 39
  • 40. SKOS est construit sur la base du langage RDF, et son principal objectif est de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre du Web de données. les propriétés de mise en correspondance proposées dans SKOS permettent d'exprimer des correspondances entre concepts provenant de schémas différents l skos:exactMatch ou skos:closeMatch l skos:broadMatch, skos:narrowMatch, skos:relatedMatch l skos:semanticRelation Encoder et lier les métadonnées: skos (simple knowledge organisation system) le thésaurus à l’heure du web 40
  • 41. http://data.culture.fr/thesaurus/resource/ark:/67717/T1-1302 dct:created "2014-03-12T19:13:55+0100" ; dct:modified "2012-11-22T00:00:00+0100" ; iso-thes:status "1" ; a skos:Concept ; skos:exactMatch <http://data.bnf.fr/ark:/12148/cb13318807v> ; skos:historyNote "2011-12-07 : modification du prefLabel « Education" en « Education et sciences""@fr-fr ; skos:inScheme <http://data.culture.fr/thesaurus/resource/ark:/67717/Matiere> ; skos:narrower <http://data.culture.fr/thesaurus/resource/ark:/67717/T1-1121> , <http://data.culture.fr/thesaurus/resource/ark:/67717/T1-3> , <http://data.culture.fr/thesaurus/resource/ark:/67717/T1-499> , <http://data.culture.fr/thesaurus/resource/ark:/67717/T1-881> ; skos:prefLabel « Education et sciences"@fr-fr ; <http://www.w3.org/2008/05/skos-xl#prefLabel> <http://data.culture.fr/thesaurus/resource/ark:/67717/ce918de4-581a-49a6-83ef-d8932deb73d6> ; foaf:focus <http://dbpedia.org/resource/Education> . Encoder et lier les métadonnées: skos (simple knowledge organisation system) le thésaurus à l’heure du web 41
  • 42. Encoder et lier les métadonnées : skos (simple knowledge organisation system) le thésaurus à l’heure du web 42
  • 43. langage à balises permettant de structurer et de décrire un ensemble d’objet au sein d’espace de noms • langage hiérarchique permettant de décrire des relations • langage de transport d’information permettant de standardiser les échanges de données • peut être décrit par un schéma ou une DTD • peut servir au stockage des données mais également à leur interrogation <xml version="1.0" encoding="UTF-8"?> <ex:collection xml:lang="fr" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns=http://www.w3.org/1999/xhtml xmlns:ex="http://exemple.org"> <ex:vehicule> <dc:title>Mon super vélo</dc:title> <velo id="2"> <taille>76</taille> <marque>cool bike</marque> <modele>speeder</modele> </ex:velo> <ex:velo taille="76" marque="coolbike" modele="speeder" id="2" /> Encoder et lier les métadonnées: xml (extensible markup language) : la lingua franca de l’encodage d'information 43
  • 44. Il est souvent nécessaire d’expliciter l’information en décrivant son contexte et ses relations Encoder et lier les métadonnées: la description du contexte 44
  • 45. Au départ le monde selon EAD Encoder et lier les métadonnées: construction d’une ontologie 45
  • 46. Les objets à modéliser HTTP://ARCHIVESHUB.AC. UK/LOCAH/ Encoder et lier les métadonnées: identifier les concepts 46
  • 47. Les relations entre concepts Encoder et lier les métadonnées: identifier les relations 47
  • 48. Et hop une ontologie ! http://data.archiveshub.ac.uk/ Réutilisant des vocabulaires existants RDF Schema (RDFS): http://www.w3.org/2000/01/rdf- schema# Dublin Core Terms: http://purl.org/dc/terms/ Friend of a Friend (FOAF): http://xmlns.com/foaf/0.1/ Simple Knowledge Organisation System (SKOS): http://www.w3.org/2004/02/skos/core# Object Reuse & Exchange (ORE): http://www.openarchives.org/ore/terms/ Vocabulaire biographique : http://purl.org/vocab/bio/0.1/ Event Ontologie: http://purl.org/NET/c4dm/event.owl# Linked Open Data Events vocabulary (LODE): http://linkedevents.org/ontology/ Timeline Ontologie: http://purl.org/NET/c4dm/timeline.owl# Encoder et lier les métadonnées: en route pour les usages 48
  • 49. Encoder et lier les métadonnées prov-o : les métadonnées de provenance : modèle générique Le schéma ci-contre représente les trois principales entités du modèle PROV-O ainsi que les relations qu'elles peuvent avoir les unes avec les autres. 49
  • 50. Entity (Entité) Dans le modèle PROV, une entité est une ressource dont on veut décrire la provenance. « Une entité est un objet physique, numérique, conceptuel ou tout autre type d’objet avec des aspects déterminés ; les entités peuvent être réelles ou imaginaires. » Par exemple : un document, une partie d'un document, une idée, un article de nouvelles, un contrat, un résultat, etc. Activity (Activité) Les activités sont les processus qui ont utilisé ou généré des entités, comme par exemple : calculer un résultat, écrire un livre, faire une présentation. Les activités ne sont pas des entités. « Une activité est quelque chose qui se produit pendant une période déterminée et qui agit sur ou avec des entités ; elle peut inclure l’utilisation, la transformation, la modification, la délocalisation, ou la génération d’entités. » Agent (Agent) Les agents sont responsables des activités affectant les entités. Un agent est quelque chose qui porte une forme de responsabilité dans le déroulement d'une activité, dans l’existence d’une entité ou dans l’activité d’un autre agent. Ce peut être une personne, une composante de logiciel, un objet inanimé, une organisation, ou une autre entité. Encoder et lier les métadonnées prov-o les métadonnées de provenance : modèle générique 50
  • 51. Les entités, les activités et les agents peuvent interagir les unes par rapport aux autres : • d'un point de vue temporel : • une Entité a été générée (wasGeneratedBy) par une Activité ; • une Activité a utilisé (used) une Entité ; • une Activité a été fondée (wasInformedBy) sur une autre Activité ; • une Entité est dérivée (wasDerivedFrom) d'une autre Entité ; • une Activité a commencé (startedAtTime) à une Date/heure donnée ; • une Activité s'est terminée (endedAtTime) à une Date/heure donnée. • du point de vue de la responsabilité : • une Activité a été associée (wasAssociatedWith) à un Agent ; • une Entité a été attribuée (wasAttributedTo) à un Agent ; • un Agent a agi pour le compte (actedOnBehalfOf) d'un autre Agent. Encoder et lier les métadonnées prov-o : les métadonnées de provenance Les interactions 51
  • 52. Generation (Génération) Les activités génèrent de nouvelles entités. La génération permet de décrire l'origine des entités et de répondre à des questions, comme par exemple : comment un document a-t-il été généré ? Comment un résultat de calcul a-t-il été obtenu ? Comment une entité a-t-elle été modifiée ? Comment un résultat a-t-il été validé ?   Usage (Utilisation) Les activités utilisent également des entités. L'utilisation permet de préciser quelles sont les entités qui ont participé à une activité, par exemple : les références utilisées pour créer un document, la requête faite pour obtenir un résultat ou encore les flux entrants d'un processus informatique.   Communication (Communication) La communication sert à décrire l'interdépendance entre deux activités. Quelles sont les activités qui ont précédé l’activité actuelle ? Quelles sont les étapes nécessaires pour exécuter une requête ?  Attribution (Attribution) L'attribution est l'assignation d'une activité à un agent. Elle permet de répondre à des questions comme par exemple : qui est l'auteur d'un document particulier ? Quel logiciel a été utilisé pour générer tel résultat ? Qui a créé tel jeu de données ? Encoder et lier les métadonnées prov-o : les métadonnées de provenance Les typages des relations 52
  • 53. Derivation (Dérivation) Les activités utilisent et génèrent des entités. Dans certains cas, l'utilisation d'une entité a une influence sur la création d'une autre entité. Cette « influence » ou dérivation est la transformation d'une entité en une autre entité, le résultat de la mise à jour d'une entité est la génération d'une nouvelle entité à partir de l'entité préexistante. La dérivation permet de décrire l'interdépendance de différentes entités entre elles. Par exemple : les contenus d’un document s’appuient-ils sur d’autres entités ? Quelles ressources ont influencé cette entité et dans quelle mesure ?   Association (Association) Un agent peut se voir attribuer une certaine responsabilité dans le déroulement d'une activité. D’après le modèle PROV, l'Activité est associée à l'Agent. La relation d'association permet de répondre à des questions comme par exemple : qui a la responsabilité d'un document ? Qui a la responsabilité de l'élaboration d'un produit/contrat ?   Delegation (Délégation) La délégation est l'assignation d'une autorité et d'une responsabilité à un agent (par lui-même ou par un autre agent) pour exercer une activité spécifique comme délégué ou représentant, tandis que l'agent pour le compte duquel il agit détient une certaine responsabilité dans le résultat du travail qui a fait l'objet de la délégation. La délégation sert à préciser les responsabilités de plusieurs agents les uns par rapport aux autres. Par exemple : quel utilisateur a activé tel outil pour générer tel rapport ? encoder et lier les métadonnées prov-o : les métadonnées de provenance Les typages des relations 53
  • 54. Le modèle étendu est une extension des principaux concepts de PROV-O. Le schéma ci-dessous présente les concepts supplémentaires permettant de décrire plus finement la provenance. Encoder et lier les métadonnées prov-o : les métadonnées de provenance : modèle générique 54
  • 55. Le schéma SEDA permet de décrire les relations entre les acteurs au cours des échanges (transfert, de communication, de modification, d'élimination ou de restitution d’archives). • • Il permet d'automatiser les procédures d'échange d'information en décrivant les règles contractuelles qui régissent le versement et la prise en charge d'un paquet d'information. • • Les messages SEDA décrivent les contraintes (format, support, identification) et fournissent un historique des opérations effectuées (transfert, réception, destruction, etc..) • • La grammaire XML permet de définir des règles formelles vérifiables par les machines (est égal à, ne peut pas être différent de, n'existe qu'en un seul exemplaire, provient de, etc...) Encoder et lier les métadonnées seda: schéma d’échange des données d’archivage 55
  • 56. • Le schéma MEDONA Z 44-022 permet de structurer les métadonnées générées par les acteurs au cours des échanges (transfert, de communication, de modification, d'élimination ou de restitution d’archives). • Il doit permettre de modéliser les échanges de données pour l‘archivage et d'automatiser les procédures d'échange d'information en décrivant les règles contractuelles qui régissent le versement et la prise en charge d'un paquet d'information. Les messages MEDONA décrivent les contraintes (format, support, identification) et fournissent un historique des opérations effectuées (transfert, réception, destruction, etc..) • • La grammaire XML permet de définir des règles formelles vérifiables par les machines (est égal à, ne peut pas être différent de, n'existe qu'en un seul exemplaire, provient de, etc...) Encoder et lier les métadonnées medona: structurer les métadonnées des documents d’activité 56
  • 57. • La classe ManagementMetadata regroupe l'ensemble des informations nécessaires à la gestion de l'échange d'un paquet de données. Les informations apportées par cette classe concernent tous les Objets de données du paquet. Ces informations sont : • l'accord de service (ArchivalAgreement), • le profil d'archivage (ArchivalProfile), • le niveau de service (ServiceLevel), • la règle d'accessibilité (AccessRule) • la règle pour le calcul du sort final (AppraisalRule). Toutes ces informations sont facultatives. Encoder et lier les métadonnées medona: structurer les métadonnées des documents d’activité 57
  • 58. Encoder et lier les métadonnées medona: structurer les métadonnées des échanges Tous les messages partagent des propriétés communes définies dans la classe Message. Ces propriétés sont : • une date (Date) qui correspond à la date d'émission du message • un identifiant du message (MessageIdentifier) ; • éventuellement des commentaires (Comment) qui permettent en particulier d'expliquer la raison du message (par exemple pour une réponse négative, ces commentaires peuvent expliquer la raison du refus et ce qu'il convient de faire pour reformuler la demande) • éventuellement une signature du message lui-même (Signature). Le message d'accusé de réception (Ackwowledgement) hérite des propriétés de la classe Message auxquelles il faut ajouter l'identifiant du message dont il accuse la réception. 58
  • 59. Encoder et lier les métadonnées medona: extension aux besoins d’une communauté Une communauté peut créer son propre schéma XML dérivé celui de la norme sans avoir à intervenir sur le schéma de la norme en incluant le schéma de la norme dans le sien tout en redéfinissant sous forme de restriction les types laissés ouverts: DescriptiveMetadataType, OrganizationDescriptiveMetadataType SignatureType AccessRuleType) Par exemple, si cette communauté souhaite utiliser le modèle EAC-CPF 19) pour décrire les acteurs (Service versant, Service producteur, etc.), elle donnera une autre définition du type OrganizationDescriptiveMetadataType dans son schéma dérivé. De cette manière les messages qui respectent ce nouveau schéma respectent forcément le schéma de la norme. <xsd:schema targetNamespace="org:afnor:www:medona:v1.0" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:medona="org:afnor:www:medona:v1.0" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:eac="urn:isbn:1-931666-33-4"> <xsd:import namespace="urn:isbn:1-931666-33-4" schemaLocation="cpf.xsd"/> <xsd:import namespace="http://www.w3.org/1999/xlink" schemaLocation="xlink.xsd"/> <xsd:redefine schemaLocation="MEDONA.xsd"> <xsd:complexType name="OrganizationDescriptiveMetadataType"> <xsd:complexContent> <xsd:restriction base="medona:OrganizationDescriptiveMetadataType"> <xsd:sequence> <xsd:element ref="eac:cpfDescription"/> </xsd:sequence> <xsd:attribute ref="xlink:href" use="prohibited"/> </xsd:restriction> </xsd:complexContent> </xsd:complexType> </xsd:redefine> </xsd:schema> 59
  • 60. Encoder et lier les métadonnées dublin core: ppdc et interopérabilité • permet l'interopérabilité entre des données d'un domaine ou entre des domaines hétérogènes (Plus Petit Dénominateur Commun) • 15 éléments optionnels répétables et qualifiables • profils d’implémentation permettant d’échanger facilement des données entre différents domaine • permet de s’intégrer dans des portails documentaires transversaux • permet de gérer les descriptions hétérogènes au sein d’une archive OAIS 60
  • 61. SOMMAIRE 61 Numérique et pratiques archivistiques Quelle organisation mettre en place ? Pourquoi les metadonnées ? Comment favoriser l’accès numérique au patrimoine culturel ?
  • 62. 6 verbes pour un échange de données normalisé qui?: la carte d'identité de l'entrepôt quand?: les dates de modification comment?: les standards de métadonnées xml les collection de données combien?: la liste des identifiants uniques la liste des fiches descriptives quoi?: le contenu de la fiche descriptive Notice d'identité Notice descriptive humainobjet numérique entrepôts moissonneurs agrégateur portail Contenu culturel l’accès à l’information par les métadonnées : oai- pmh un protocole d’échange ouvert 62
  • 63. l’accès à l’information par les métadonnées a quoi ça sert ? construire un espace global d’information 63
  • 64. l’accès à l’information par les métadonnées a quoi ça sert ? favoriser le rebond 64
  • 65. l’accès à l’information par les métadonnées a quoi ça sert ? favoriser la sérendipité 65
  • 66. l’accès à l’information par les métadonnées a quoi ça sert ? augmenter l’expérience de l’usager 66
  • 67. L’accès à l’information par les métadonnées a quoi ça sert ? valoriser les ressources patrimoniales 67
  • 68. RÉFÉRENCES • Édition ouverte : http://fr.slideshare.net/btsmultimedia/planchenmipdf?next_slideshow=1 • Feuille de route ministère de la culture : http://bit.ly/mccWeb3 • Exploration du rdf : http://en.lodlive.it/?http://dbpedia.org/resource/Boris_Vian Culture clic : http://youtu.be/ARi03GxVvZY  Publications: Coyle, Karen, Understanding the Semantic Web: Bibliographic Data and Metadata. Library Technology Reports, Janvier 2010 Séminaire INRIA, Métadonnées: mutations et perspectives, ADBS, 2008 Crédits: Aurélien Couraux, Gautier Poupeau, Emmanuelle Bermès, Ivan Herman, Fabien Gandron : présentations sur le web illustrations: jlmaral, widdowquinn, wiccked, Fenng(dbanotes), LaChan, Laughing Squid, LZdR, woicik CC BY-NC 2.0 Liens : SEDA: http://www.archivesdefrance.culture.gouv.fr/seda/ MODS http://www.loc.gov/standards/mods/ Dublin Core http://dublincore.org/ SKOS http://www.w3.org/TR/skos-reference/ METS http://loc.gov/METS RDF http://www.W3C.org/RDF OWL2 http://www.W3C/OWL2 ARK https://confluence.ucop.edu/display/Curation/ARK OAI-PMH http://www.openarchives.org/OAI/openarchivesprotocol.html Contact: p.romain@cg33.fr twitter: @keronos 68
  • 69. 69  Contact : École nationale des chartes service de la formation continue 65, rue de Richelieu - 75002 Paris T. +33 (0)1 55 42 21 53 et 19, rue de la Sorbonne - 75005 Paris T. +33 (0)1 55 42 88 78 formation.continue@enc.sorbonne.fr