SlideShare uma empresa Scribd logo
1 de 43
Métadonnées
Représentation et accès à l’information

                  INRIA
           Seminaire 2008


           par Sylvie Dalbin - ATD
              sylvieATD@aol.com


                    (1)
Fil conducteur de l’intervention

1. Contexte de l’intervention
          1. Contexte du séminaire
          2. Contexte professionnel

2. Métadonnées
          1.   Définition
          2.   Processus de conception
          3.   Outils de modélisation
          4.   Architecture
          5.   Administration et qualité

3. Axes d’évolution
          1.   Des listes d’autorité aux répertoires sémantiques
          2.   Représenter des langues
          3.   Convergence et spécificités des modèles
          4.   Accès immédiat aux corpus numériques : le cas des thèses

4. Conclusion

INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                              29 Sept 2008 -
1.




     1. CONTEXTE DE
     L’INTERVENTION

     Contexte du séminaire
     Contexte professionnel
1.1
                  Contexte du séminaire

  • Introduction au thème de la semaine Inria
  • S’ouvrir aux différents mondes qui se rencontrent
      – Les mondes des différents intervenants et les vôtres
      – Autour de la notion de métadonnées
         • Sur les plans fonctionnel et technique
         • Et des notions connexes : granularité, notation, terminologie, …
      – Par une mise en perspective inter-professionnel (Archives,
        Documentation, Bibliothèques, Musée)
      – En partant de la réalité d’hier et d’aujourd’hui

  • En complément (mardi 30 sept) :
      – « Métadonnées et normalisation », Atelier

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
1.2
                   Contexte professionnel
  • Du livre aux ressources
        •   Du papier au numérique - Du mono- au pluri- et multi-média
        •   D’un objet (le livre) à des grains d’information contextualisés
        •   Immédiateté ; Flux et volumes
        •   Métadonnées plus riches, mieux contrôlées
        •   Métadonnées métiers : à la source
        •   Des contenus exploitables

  • Accès à l’information à l’ère de la Société de l’Info
        • Tout citoyen dans ses activités professionnelles (et personnelles)
        • Des besoins étendus, fréquents, diversifiés
        • Dont la nature diffère de celle du « chercheur » (scientifique)

  • Automates : le cœur des systèmes
        • Moteurs et automatisme : quelle place pour l’Humain
        • Interopérabilité (à distinguer de centralisation)

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.




     2. METADONNEES

            Définition
     Processus de conception
              Outils
           Architecture
2.1
      Métadonnée : représentation + codage

      Représentation réinterprétable

      d'une information, sous forme

      conventionnelle convenant à la

      communication, à l'interprétation

      ou au traitement.



                                          membres.lycos.fr/jjww/50.htm
                                          .


  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.2
                 Processus de conception
      La Vie,
      Les Choses de la Vie



            A - Représentation Métier
                  A1 - Modéliser et formaliser le modèle métier
                  A2 - Développer des Référentiels métier




                  B - Représentation Informatique
                          B1 - Concevoir un modèle informatique sur la base du modèle
                          conceptuel métier
                          B2 - Développer un schéma de données


  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.2
       Processus A : Représentation métier
                                      Favoriser la guérison en
         Une réalité - Un objectif    décrivant précisément
                                      les maladies


                A1 - Modéliser        « Modèle conceptuel
                                      biomédical » des
           Formaliser ce modèle       conséquences des
                                      maladies, années 1940

                A2 - Développer       Langage médical :
        des Référentiels métier       Classification
                                      internationale des
      pour alimenter ces modèles      maladies (CIM)

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.2
           Processus B : Représentation SI
                  B1 - Concevoir            ClaML Classification Markup
                                             Language
      un modèle informatique sur
                                            « support the transfer of the majority of
               la base du modèle             hierarchical healthcare classification
                conceptuel métier            systems »

                                            <Class kind="category">
                                            <Symbol>A04</Symbol>
                                                <SuperClass>A00-A09</SuperClass>
                                            <Rubric xml:lang=“en"
                                            kind="preferred">Other bacterial
                 B2 - Développer            intestinal infections</Rubric>
           un schéma de données                 <Rubric xml:lang=“en"
         - représentation des ressources    kind="excludes">foodborne intoxications,
        - Représentation des référentiels   bacterial
                                            (<Reference>A05</Reference>)</Rubric>
                                                <Rubric xml:lang=“en"
                                            kind="excludes">tuberculous enteritis
                                            (<Reference>A18.3</Reference>)</Rubri>
                                            </Class>
  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.2
       Outils: langages à tous les étages
  Le langage : moyen d'expression et de représentation
  • Langages de représentation des SI
           – Représention graphique UML, entité-attribut-classe, Schémas XML

  • Langages de représentation des ressources
           – Des champs aux schémas de métadonnées

  • Langages de représentation de concepts/entités
           – Langages documentaires, langage d’indexation, de recherche
           – Langages de représentation d’entités nommées
               » Des listes d’autorité aux référentiels sémantiques
           – Langages de représentation Métier ou Domaine
             représentation des activités et non des ressources seules


          Représenter les activités - pas uniquement les ressources
         Repositionner les notions de classes, concepts, sujet
  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.3
      Outils : modèle entité-relation-attribut

  Outil de modélisation de données de haut niveau
  Modèle « Entité-Association » (1970->)
      – Entité
             – Objet pourvu d’une existence : un ou des individus (un auteur, une
               société, un gène, etc.), une chose concrète ou abstraite
               (publication, pays, etc.), un événement (facture, manifestation, etc.).
      – Relation
             – Association fonctionnelle entre deux entités ou classes d’entités.
      – Attribut ou propriété
             – Données élémentaires sur une entité (date ou lieu de naissance
               d’une personne) ou sur une relation.
      – Cardinalité
             – Dimension ou degré de la relation; nombre d'entités impliquées
               dans cette relation : une seule entité (réflexive), minimum (0 ou 1) et
               maximum (n).

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.3
       Outils : modèle entité-relation-attribut
                 Une représentation (partielle) du domaine Musique
           identifiant                                  relation




Instance de la            entités           attributs         Instance de la
classe Oeuvre                                                 classe Personne

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.4
  Architecture des composants fonctionnels
      Réservoirs de connaissances


                        Référentiel                                        Accès
                                   Ontologie
                               (structure des connaissances)
                                                                         Recherche
          Administrer




                                Base de connaissances                So what de Miles Davis

                                Vocabulaires contrôlés
                                     Thésaurus                          Taxonomie
                                                                       de navigation
                         Métadonnées                               Métadonnées Métiers
                                                                   Œuvres, Personnes,
                                                                   Concerts,…
                            Données                     Moteur
                                                          de       Autres métadonnées
           Indexer




                           vidéo, photo,                           Titre, format, support,…
                           texte, artefact             recherche
                                                                   Vocabulaire enrichi
                                                                   Synonymes et traductions
                                                                   Autres relations




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
Fonction d’administration


Administration des métadonnées
    Qualité des Référentiels
2.5
        Administration des métadonnées

  • Les applications s’auto-référencent ?
        • Elaborer une documentation « informatique » et « métier »

  • Documenter le référentiel des applications
        • Règle de documentation : norme ISO 11179 (MDR)
        • Autres règles : ISO 9735-2:2002 pour les données composites

  • Enregistrer schémas et profils d’application
        • les « agences d’enregistrement » de l’ISO 11179
        • Profils d’application: schéma + règle + système d’encodage +
          tableau de concordance
        • Reprise du projet « Registry » au sein du Dublin Core



  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.5
      Métadonnée « Contribution person »




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
2.5
                  Qualité des référentiels

  • Qualité de quoi ?
      – la qualité du modèle initial
      – La qualité des données elles-mêmes
      – La qualité interne du schéma de métadonnées
      – La qualité externe du schéma de métadonnées
      – La qualité des vocabulaires d’encodage

  • Quel contrôle ?
      – Pour chacune de ces catégories
      – Par échantillonnage sur les données et leurs usages à la
        recherche et à l’indexation



  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.




     3. AXES D’EVOLUTION


      Quelques axes d’évolution
      dans ce nouveau contexte
3.
          Présentation de 4 axes d’évolution

     1. Des listes d’autorité aux répertoires sémantiques
                Le cas du Catalogue de la Cité de la Musique


     2. Métadonnées composites et choix d’encodage
           •   Les normes du Web
                Le cas de la représentation des « langues » (rfc 4646)


     3. Convergence et spécificités des modèles
                Le cas des modèles éditorial, bibliothéconomique, archivistique et
                 documentaire


     4. Accès immédiat aux corpus numériques
                Le cas des thèses



     INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                   29 Sept 2008 -
3.1




           #1. Des listes d’autorité
         aux répertoires sémantiques
      Le cas du Catalogue de la Cité de la Musique
3.1
             Référentiel sémantique (1)




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.1
               Référentiel sémantique (2)

  • Schémas de métadonnées
      – Cohérents et coordonnés

  • Répertoires contrôlés et enrichis : des ressources
      – Des entités identifiées (identifiant, uri)
      – Des entités contrôlées
              Les Titres de partition, d’œuvres, d’ouvrages, de concerts,…
              Les Noms des musiciens, compositeurs, éditeurs ….
              Les Noms des instruments
              Les Fonctions/Rôles
      – Des entités enrichies par des attributs
              Les valeurs de certains attributs sont elles-mêmes contrôlées




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.1
               Référentiel sémantique (3)
  • Finalités
      – Ré-exploitations multiples
         • Grâce aux Entités - Attributs - Relations
      – Logiques de recherche/navigation du Web
      – Optimisation économique

  • Quelles évolutions ?
      – Connaissances sur le domaine, plus que catalogue de documents
         • La Musique à travers ses compositeurs, ses œuvres, ses
           instruments, ses interprétations,…
      – Fluidité des liens entre « nœuds » versus rigidité des notices
      – Offres construites avec des applications composites mêlant
        des ressources pas toujours homogènes
         • Interopérabilité structurelle

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.2




            #2. Métadonnées composites
                 et choix d’encodage
                       Les normes du Web
      Le cas de la représentation des « langues » (rfc 4646)
3.2
           Représentation des langues (1)
  • Analyse du problème posé
      – Langue
             – la langue écrite dans un système d’écriture particulier
                  » la langue chinoise - alphabet chinois ou romanisé (pinyin)
             – La langue parlée
             – Dans une région précise du monde » En-UK, En-US, en-CA
      – Unité traitée
             – La langue d’un document textuel, d’une mention sur une affiche, du
               sous-titrage, de leurs traductions, d’annotations..
             – Supports plurilangues
      – Dans le temps
             – Prise en compte de l’évolution des Pays en particulier
             – Des langues anciennes
      – Langues et pays : écriture éponyme » deu et non ger
      – Règles d’encodage du Web - XHTML, HTML, CSS

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.2
           Représentation des langues (2)

  • Métadonnée composite du W3C
      – Sur la base de la RFC 4646 (Tags for Identifying Languages)
      – Finalités
             – Accès direct aux ressources
             – Répondre précisément aux besoins
             – Prendre en compte les particularismes régionaux à travers le
               monde
             – Intégré à Dubin Core / ISO 15836

                         zh      -    Latn       -    CN
                    [ISO 639-1] [ISO 15924] [ISO 3166]

                       de        -      CH       -    1996
                    Allemand utilisé en Suisse, écrit après la réforme de l'orthographe
                       entamée en 1996 après J.C.


  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.2
          Représentation des langues (3)

  • Quelles évolutions ? Jusqu’où aller ?
      – Représentation et encodage fins d’éléments de donnée
        appartenant à un schéma de représentation global
             – La langue telle qu’elle est parlée ou écrite
             – Mais aussi Contributeur = Personne - Rôle - Date, répétable


      – Associer des métadonnées à des grains d’information
             – L’interview d’une personnalité au sein d’une séquence


      – S’aligne-t-on sur les exigences des technologies du Web ?
             – accès direct aux ressources, caractère international, précision de la
               description de tout ou partie des ressources,…




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3




         #3. Convergence et spécificités
                 des modèles
      Le cas des modèles éditorial, bibliothéconomique,
               archivistique et documentaire
3.3
             Modèles documentaires (1)
  • Points de vue variés sur des objets informationnels
    ou des activités des Audiences
  • Critères nombreux
        • Unité de traitement privilégiée
        • Résultat : schéma de représentation (notice)
        • Appartenance à des collections : thématiques, par filiation,…
        • Structure prise en charge ; interne ou externe à l’objet
        • Usages de cette représentation
          (en recherche, avec ou sans outils supplémentaires…)
        • Reconnaissance (ou pas) de cette méta-structure par les
          audiences visées
        • Existence ou pas de formats normalisés (e-books).
          Existence ou pas d’outils de production
  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3
              Modèles documentaires (2)

  A. Structuration orientée par l’objet physique  
      1. Modélisation éditoriale
      2. Modélisation bibliographique

  B. Structuration orientée par les contenus  
      3. Modélisation Contenu de premier niveau
      4. Modélisation Structurelle de premier niveau
      5. Modélisation Genre

      6. Modélisation Domaine ou Métier (contexte)
      7. Modélisation Collection (contenu/contexte) 


  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3
             Modèles documentaires (3)

  1. Modélisation éditoriale
        • L’objet pris comme un tout, appartenant à une collection (filiation)
        • Structure interne visible
            – supportant la navigation intra-documentaire
            – Connue par un large public
        • Formats normalisés (e-book)

  2. Modélisation bibliographique
        • L’objet pris comme un tout, appartenant à une collection
          (acquisition)
        • Structure externe à l’objet (notice)
            – Connue par un large public
            – N’intègre pas (ou très peu) la sémantique structurelle éditoriale
        • Formats normalisés

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3
             Modèles documentaires (4)

  3. Modélisation Contenu de 1er niveau
        • L’objet pris comme un tout, appartenant à une collection (filiation)
        • Structure externe à l’objet enrichie de métadonnées d’accès
            – Offrant une vue synthétique (sujet), mais externe à l’objet
            – Territoire fixé par l’objet

  4. Modélisation Structurelle de 1er niveau
        • L’unité documentaire est « décrochée » par rapport à l’unité
          éditoriale ou bibliographique (article, reportage, …) créant après
          la collection et l’objet, un 3ème niveau
        • Structure externe à l’objet enrichie de métadonnées d’accès
            – Offrant des accès analytiques pluriels




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3
             Modèles documentaires (5)

  5. Modélisation Genre
        • L’objet pris comme un tout, appartenant à une famille particulière
        • Structure intra-documentaire prédéterminée par le genre, non
          formelle
            – Connue par un public au sein de communautés métiers
            – Métagenres (compte-rendu de réunion), genres spécialisés
            – Traduit dans le modèle documentaire par une seule métadonnée

  6. Modélisation Domaine ou Métier
        • Prend appui sur les activités et non spécifiquement les objets
        • Structure de représentation du domaine, externe aux ressources,
          indépendante de celles-ci
            – Connue par les acteurs du domaine et touche un public large au
              sein du domaine


  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3
              Modèles documentaires (6)

  7. Modélisation Collection
      – Intégration des objets au sein d’un schéma d’ensemble
         • Collection éditoriale, d’une bibliothèque, d’un musée, fonds d’une
           centre documentaire, fonds d’archives
         • Le référent de cette structure est varié : filiation ou contexte de
           production , savoir encyclopédique ou domaine spécialisé,
           activités…


      Dans un contexte de fédération de ressources
      (portail), il est possible de rendre convergents ces
      différents points de vue, tout en conservant les
      spécificités de chacun.
  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3
             Modèles documentaires (6)
  • Granularité de l’unité de traitement choisie




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.3
         Modèle documentaire générique




  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.4




       #4. Accès immédiat
      aux corpus numériques
          Le cas des thèses
3.4
                  Le cas des thèses (1)

  • Recommandation TEF de 2006
        • « définit un jeu de métadonnées pour les thèses électroniques
          soutenues en France.
        • […] a voulu valoriser les thèses françaises grâce à leur diffusion
          électronique et engager une politique de dépôt et de
          conservation qui assure leur pérennité. »

  • Optimiser un circuit éditorial
        • Postérieur à la création de l’objet
        • Métadonnées de type bibliographique et administrative


                                 Un modèle éditorial post-publication


  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.4
                   Le cas des thèses (2)
  • Améliorer aussi l’exploitation des thèses
        • Accès immédiat au corpus, lecture non linéaire, parcours,
          exploitation partielle,…

  • Insérer des connaissances propres au domaine
        • Structuration interne de la thèse (genre)
            – Etat de l’art, méthodologie, modèle, algorithme, architecture,
              prototype ou étude de cas d’une thèse scientifique
            – A formaliser dans le jeu de métadonnées
        • Offrir des possibilités d’indexation sociale par les lecteurs

  • Adosser ces nouvelles métadonnées au schéma
    existante
        • Métadonnée : éditoriale, bibliographique, administrative et de
          contenu


  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
3.4
                          Le cas des thèses (3)
                                                  C. Roussey - Une méthode d’indexation
  • Etat de l’art sur l’indexation dans           sémantique adaptée aux corpus multilingues, 2001
                                                  Sommaire de la thèse
    différents types de SRI
  • Méthode d’indexation proposée
      Index : modèle des graphes sémantiques,
      extensions tels thesaurus sémantique,
      opérateur de projection et algorithmes;
      annotation et indexation;
  • Expérimentation
      Index : prototype SyDOM, bibliothèque
      (lieu d’exp.), évaluation de l’indexation
  • Perspective
  • Terminologie
      Index : indexation automatique, système
      de représentation de concepts, ressource
      linguistique
  • Article (grain autonome) sur les
      systèmes de recherche multilingue

  INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                29 Sept 2008 -
4.




     Conclusion provisoire…
4.
             Complexité de mise en oeuvre
     • Malgré les qualités des technologies du Web
           • Ouverture, interopérabilité technique, normalisation,…

     • Des difficultés de conception et de mise en œuvre
           • Normalisation, méthodes et outils : mobilité très grande
           • Contenu et systèmes ouverts
                   »   Penser autrement territoires et périmètres
                   »   Articuler différents modèles, schémas et langages
                   »   Complexité de la reprise de l’existant
                   »   Importance des travaux de modélisation
           • S’ouvrir aux pratiques et besoins des Utilisateurs
                   » Renouveler l’ ergonomie et les services
           • Economie des dispositifs et coût des transformations
           • Accompagner le changement : formation de formateurs

                            Adopter un esprit ouvert et critique
     INRIA IST - Session introductive sur les métadonnées par Sylvie D
                                                   29 Sept 2008 -

Mais conteúdo relacionado

Destaque

T A L L E R I N D I V I D U A L R E D E S[1][1][1]
T A L L E R  I N D I V I D U A L  R E D E S[1][1][1]T A L L E R  I N D I V I D U A L  R E D E S[1][1][1]
T A L L E R I N D I V I D U A L R E D E S[1][1][1]edith echeverria
 
2013 mada'in saleh - soeur de petra
2013   mada'in saleh - soeur de petra 2013   mada'in saleh - soeur de petra
2013 mada'in saleh - soeur de petra ciffer louis
 
Présentation Media Sociaux (draft)
Présentation Media Sociaux (draft)Présentation Media Sociaux (draft)
Présentation Media Sociaux (draft)SlideRescue
 
La beaute-du-passe-simple-sp782
La beaute-du-passe-simple-sp782La beaute-du-passe-simple-sp782
La beaute-du-passe-simple-sp782ciffer louis
 
La figura humana
La figura humanaLa figura humana
La figura humanarjardi
 
Les chèques Easykado.com
Les chèques Easykado.comLes chèques Easykado.com
Les chèques Easykado.comeasykado
 
Jose vasquez actividad_3
Jose vasquez actividad_3Jose vasquez actividad_3
Jose vasquez actividad_3Ramiro Vasquez
 
Usage des valeurs de plans dans Tombstone
Usage des valeurs de plans dans TombstoneUsage des valeurs de plans dans Tombstone
Usage des valeurs de plans dans TombstoneSouad Azizi
 
Démo no2: Déploiement INSPIRE en région
Démo no2: Déploiement INSPIRE en régionDémo no2: Déploiement INSPIRE en région
Démo no2: Déploiement INSPIRE en régionteleparc
 
La Violencia De Genere
La Violencia De GenereLa Violencia De Genere
La Violencia De Generesaraamanda
 
PresentacióN ONG Dependencia.0
PresentacióN ONG Dependencia.0PresentacióN ONG Dependencia.0
PresentacióN ONG Dependencia.0Dependencia.0
 

Destaque (17)

Arrows
ArrowsArrows
Arrows
 
T A L L E R I N D I V I D U A L R E D E S[1][1][1]
T A L L E R  I N D I V I D U A L  R E D E S[1][1][1]T A L L E R  I N D I V I D U A L  R E D E S[1][1][1]
T A L L E R I N D I V I D U A L R E D E S[1][1][1]
 
2013 mada'in saleh - soeur de petra
2013   mada'in saleh - soeur de petra 2013   mada'in saleh - soeur de petra
2013 mada'in saleh - soeur de petra
 
Présentation Media Sociaux (draft)
Présentation Media Sociaux (draft)Présentation Media Sociaux (draft)
Présentation Media Sociaux (draft)
 
Kaysersberg
KaysersbergKaysersberg
Kaysersberg
 
DESIGN IT! Saison 4
DESIGN IT! Saison 4DESIGN IT! Saison 4
DESIGN IT! Saison 4
 
La beaute-du-passe-simple-sp782
La beaute-du-passe-simple-sp782La beaute-du-passe-simple-sp782
La beaute-du-passe-simple-sp782
 
La figura humana
La figura humanaLa figura humana
La figura humana
 
Les chèques Easykado.com
Les chèques Easykado.comLes chèques Easykado.com
Les chèques Easykado.com
 
Bi
BiBi
Bi
 
Jose vasquez actividad_3
Jose vasquez actividad_3Jose vasquez actividad_3
Jose vasquez actividad_3
 
Usage des valeurs de plans dans Tombstone
Usage des valeurs de plans dans TombstoneUsage des valeurs de plans dans Tombstone
Usage des valeurs de plans dans Tombstone
 
Démo no2: Déploiement INSPIRE en région
Démo no2: Déploiement INSPIRE en régionDémo no2: Déploiement INSPIRE en région
Démo no2: Déploiement INSPIRE en région
 
La Violencia De Genere
La Violencia De GenereLa Violencia De Genere
La Violencia De Genere
 
PresentacióN ONG Dependencia.0
PresentacióN ONG Dependencia.0PresentacióN ONG Dependencia.0
PresentacióN ONG Dependencia.0
 
French prepositions game
French prepositions gameFrench prepositions game
French prepositions game
 
Bullying inei
Bullying ineiBullying inei
Bullying inei
 

Semelhante a Représentation et accès: continuités et transformations. Chapitre 1. Transformations à l'oeuvre /

Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...Sylvie Dalbin
 
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ? Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ? Sylvie Dalbin
 
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaJean-Robert Bisaillon
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueGautier Poupeau
 
Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)Sylvie Dalbin
 
Les concepts fondamentaux de DITA
Les concepts fondamentaux de DITALes concepts fondamentaux de DITA
Les concepts fondamentaux de DITAPeccatte
 
P4 Sqli Mathieu Collet
P4   Sqli   Mathieu ColletP4   Sqli   Mathieu Collet
P4 Sqli Mathieu ColletEtesTIC2007
 
Système d info_cours1
Système d info_cours1Système d info_cours1
Système d info_cours1stage1doc
 
Ressources normalisation
Ressources normalisationRessources normalisation
Ressources normalisationrazougmed
 
Proposition de progression
Proposition de progressionProposition de progression
Proposition de progressionKhaoula Hamed
 
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...SemWebPro
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAADBSAquidoc
 
PROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.pptPROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.pptEddySHANGA
 
3 Univers Utilisateurs et 4 composants clés
3 Univers Utilisateurs et 4 composants clés3 Univers Utilisateurs et 4 composants clés
3 Univers Utilisateurs et 4 composants clésSylvie Dalbin
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersEmmanuelle Morlock
 
Groupe de Réflexion et de Production Lycée professionnel et lycée des métiers
Groupe de Réflexion et de Production Lycée professionnel et lycée des métiersGroupe de Réflexion et de Production Lycée professionnel et lycée des métiers
Groupe de Réflexion et de Production Lycée professionnel et lycée des métiersDocumentation Rouen
 
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...Yannick Prié
 

Semelhante a Représentation et accès: continuités et transformations. Chapitre 1. Transformations à l'oeuvre / (20)

Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
 
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ? Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
 
Présentation cice telos
Présentation cice   telosPrésentation cice   telos
Présentation cice telos
 
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)
 
Les concepts fondamentaux de DITA
Les concepts fondamentaux de DITALes concepts fondamentaux de DITA
Les concepts fondamentaux de DITA
 
P4 Sqli Mathieu Collet
P4   Sqli   Mathieu ColletP4   Sqli   Mathieu Collet
P4 Sqli Mathieu Collet
 
Système d info_cours1
Système d info_cours1Système d info_cours1
Système d info_cours1
 
Ressources normalisation
Ressources normalisationRessources normalisation
Ressources normalisation
 
Ist2012 aussenac-ontologieAnnotationweb
Ist2012 aussenac-ontologieAnnotationwebIst2012 aussenac-ontologieAnnotationweb
Ist2012 aussenac-ontologieAnnotationweb
 
Proposition de progression
Proposition de progressionProposition de progression
Proposition de progression
 
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
 
PROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.pptPROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
PROGRAMMATION 2e GENIE PARTIE THEORIE.ppt
 
3 Univers Utilisateurs et 4 composants clés
3 Univers Utilisateurs et 4 composants clés3 Univers Utilisateurs et 4 composants clés
3 Univers Utilisateurs et 4 composants clés
 
Projets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiersProjets d'Humanités numérique et collaboration de différents métiers
Projets d'Humanités numérique et collaboration de différents métiers
 
Vsst 2010 le_semiopole_26102010
Vsst 2010 le_semiopole_26102010Vsst 2010 le_semiopole_26102010
Vsst 2010 le_semiopole_26102010
 
Groupe de Réflexion et de Production Lycée professionnel et lycée des métiers
Groupe de Réflexion et de Production Lycée professionnel et lycée des métiersGroupe de Réflexion et de Production Lycée professionnel et lycée des métiers
Groupe de Réflexion et de Production Lycée professionnel et lycée des métiers
 
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
 

Mais de Sylvie Dalbin

Référentiels, de quoi parle-t-on ? (2013)
Référentiels, de quoi parle-t-on ? (2013)Référentiels, de quoi parle-t-on ? (2013)
Référentiels, de quoi parle-t-on ? (2013)Sylvie Dalbin
 
Normalisation outil de visibilité et de partage - ISIDORA 2011
Normalisation outil de visibilité et de partage - ISIDORA 2011Normalisation outil de visibilité et de partage - ISIDORA 2011
Normalisation outil de visibilité et de partage - ISIDORA 2011Sylvie Dalbin
 
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)Sylvie Dalbin
 
Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurus
Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurusPresentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurus
Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurusSylvie Dalbin
 
NP 25964, Future norme sur les thésaurus
NP 25964, Future norme sur les thésaurusNP 25964, Future norme sur les thésaurus
NP 25964, Future norme sur les thésaurusSylvie Dalbin
 
Quel concept se cache derriere le terme ?
Quel concept se cache derriere le terme ?Quel concept se cache derriere le terme ?
Quel concept se cache derriere le terme ?Sylvie Dalbin
 
Thesaurus à la recherche
Thesaurus à la rechercheThesaurus à la recherche
Thesaurus à la rechercheSylvie Dalbin
 

Mais de Sylvie Dalbin (8)

Référentiels, de quoi parle-t-on ? (2013)
Référentiels, de quoi parle-t-on ? (2013)Référentiels, de quoi parle-t-on ? (2013)
Référentiels, de quoi parle-t-on ? (2013)
 
Normalisation outil de visibilité et de partage - ISIDORA 2011
Normalisation outil de visibilité et de partage - ISIDORA 2011Normalisation outil de visibilité et de partage - ISIDORA 2011
Normalisation outil de visibilité et de partage - ISIDORA 2011
 
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
ISO 25964 Thésaurus pour la recherche documentaire (éditeurs logiciels)
 
Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurus
Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurusPresentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurus
Presentation (2009) du projet de norme ISO DIS 25964-1 sur les thésaurus
 
Metadonnees et SID
Metadonnees et SIDMetadonnees et SID
Metadonnees et SID
 
NP 25964, Future norme sur les thésaurus
NP 25964, Future norme sur les thésaurusNP 25964, Future norme sur les thésaurus
NP 25964, Future norme sur les thésaurus
 
Quel concept se cache derriere le terme ?
Quel concept se cache derriere le terme ?Quel concept se cache derriere le terme ?
Quel concept se cache derriere le terme ?
 
Thesaurus à la recherche
Thesaurus à la rechercheThesaurus à la recherche
Thesaurus à la recherche
 

Représentation et accès: continuités et transformations. Chapitre 1. Transformations à l'oeuvre /

  • 1. Métadonnées Représentation et accès à l’information INRIA Seminaire 2008 par Sylvie Dalbin - ATD sylvieATD@aol.com (1)
  • 2. Fil conducteur de l’intervention 1. Contexte de l’intervention 1. Contexte du séminaire 2. Contexte professionnel 2. Métadonnées 1. Définition 2. Processus de conception 3. Outils de modélisation 4. Architecture 5. Administration et qualité 3. Axes d’évolution 1. Des listes d’autorité aux répertoires sémantiques 2. Représenter des langues 3. Convergence et spécificités des modèles 4. Accès immédiat aux corpus numériques : le cas des thèses 4. Conclusion INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 3. 1. 1. CONTEXTE DE L’INTERVENTION Contexte du séminaire Contexte professionnel
  • 4. 1.1 Contexte du séminaire • Introduction au thème de la semaine Inria • S’ouvrir aux différents mondes qui se rencontrent – Les mondes des différents intervenants et les vôtres – Autour de la notion de métadonnées • Sur les plans fonctionnel et technique • Et des notions connexes : granularité, notation, terminologie, … – Par une mise en perspective inter-professionnel (Archives, Documentation, Bibliothèques, Musée) – En partant de la réalité d’hier et d’aujourd’hui • En complément (mardi 30 sept) : – « Métadonnées et normalisation », Atelier INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 5. 1.2 Contexte professionnel • Du livre aux ressources • Du papier au numérique - Du mono- au pluri- et multi-média • D’un objet (le livre) à des grains d’information contextualisés • Immédiateté ; Flux et volumes • Métadonnées plus riches, mieux contrôlées • Métadonnées métiers : à la source • Des contenus exploitables • Accès à l’information à l’ère de la Société de l’Info • Tout citoyen dans ses activités professionnelles (et personnelles) • Des besoins étendus, fréquents, diversifiés • Dont la nature diffère de celle du « chercheur » (scientifique) • Automates : le cœur des systèmes • Moteurs et automatisme : quelle place pour l’Humain • Interopérabilité (à distinguer de centralisation) INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 6. 2. 2. METADONNEES Définition Processus de conception Outils Architecture
  • 7. 2.1 Métadonnée : représentation + codage Représentation réinterprétable d'une information, sous forme conventionnelle convenant à la communication, à l'interprétation ou au traitement. membres.lycos.fr/jjww/50.htm . INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 8. 2.2 Processus de conception La Vie, Les Choses de la Vie A - Représentation Métier A1 - Modéliser et formaliser le modèle métier A2 - Développer des Référentiels métier B - Représentation Informatique B1 - Concevoir un modèle informatique sur la base du modèle conceptuel métier B2 - Développer un schéma de données INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 9. 2.2 Processus A : Représentation métier Favoriser la guérison en Une réalité - Un objectif décrivant précisément les maladies A1 - Modéliser « Modèle conceptuel biomédical » des Formaliser ce modèle conséquences des maladies, années 1940 A2 - Développer Langage médical : des Référentiels métier Classification internationale des pour alimenter ces modèles maladies (CIM) INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 10. 2.2 Processus B : Représentation SI B1 - Concevoir ClaML Classification Markup Language un modèle informatique sur « support the transfer of the majority of la base du modèle hierarchical healthcare classification conceptuel métier systems » <Class kind="category"> <Symbol>A04</Symbol> <SuperClass>A00-A09</SuperClass> <Rubric xml:lang=“en" kind="preferred">Other bacterial B2 - Développer intestinal infections</Rubric> un schéma de données <Rubric xml:lang=“en" - représentation des ressources kind="excludes">foodborne intoxications, - Représentation des référentiels bacterial (<Reference>A05</Reference>)</Rubric> <Rubric xml:lang=“en" kind="excludes">tuberculous enteritis (<Reference>A18.3</Reference>)</Rubri> </Class> INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 11. 2.2 Outils: langages à tous les étages Le langage : moyen d'expression et de représentation • Langages de représentation des SI – Représention graphique UML, entité-attribut-classe, Schémas XML • Langages de représentation des ressources – Des champs aux schémas de métadonnées • Langages de représentation de concepts/entités – Langages documentaires, langage d’indexation, de recherche – Langages de représentation d’entités nommées » Des listes d’autorité aux référentiels sémantiques – Langages de représentation Métier ou Domaine représentation des activités et non des ressources seules  Représenter les activités - pas uniquement les ressources Repositionner les notions de classes, concepts, sujet INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 12. 2.3 Outils : modèle entité-relation-attribut Outil de modélisation de données de haut niveau Modèle « Entité-Association » (1970->) – Entité – Objet pourvu d’une existence : un ou des individus (un auteur, une société, un gène, etc.), une chose concrète ou abstraite (publication, pays, etc.), un événement (facture, manifestation, etc.). – Relation – Association fonctionnelle entre deux entités ou classes d’entités. – Attribut ou propriété – Données élémentaires sur une entité (date ou lieu de naissance d’une personne) ou sur une relation. – Cardinalité – Dimension ou degré de la relation; nombre d'entités impliquées dans cette relation : une seule entité (réflexive), minimum (0 ou 1) et maximum (n). INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 13. 2.3 Outils : modèle entité-relation-attribut Une représentation (partielle) du domaine Musique identifiant relation Instance de la entités attributs Instance de la classe Oeuvre classe Personne INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 14. 2.4 Architecture des composants fonctionnels Réservoirs de connaissances Référentiel Accès Ontologie (structure des connaissances) Recherche Administrer Base de connaissances So what de Miles Davis Vocabulaires contrôlés Thésaurus Taxonomie de navigation Métadonnées Métadonnées Métiers Œuvres, Personnes, Concerts,… Données Moteur de Autres métadonnées Indexer vidéo, photo, Titre, format, support,… texte, artefact recherche Vocabulaire enrichi Synonymes et traductions Autres relations INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 15. Fonction d’administration Administration des métadonnées Qualité des Référentiels
  • 16. 2.5 Administration des métadonnées • Les applications s’auto-référencent ? • Elaborer une documentation « informatique » et « métier » • Documenter le référentiel des applications • Règle de documentation : norme ISO 11179 (MDR) • Autres règles : ISO 9735-2:2002 pour les données composites • Enregistrer schémas et profils d’application • les « agences d’enregistrement » de l’ISO 11179 • Profils d’application: schéma + règle + système d’encodage + tableau de concordance • Reprise du projet « Registry » au sein du Dublin Core INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 17. 2.5 Métadonnée « Contribution person » INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 18. 2.5 Qualité des référentiels • Qualité de quoi ? – la qualité du modèle initial – La qualité des données elles-mêmes – La qualité interne du schéma de métadonnées – La qualité externe du schéma de métadonnées – La qualité des vocabulaires d’encodage • Quel contrôle ? – Pour chacune de ces catégories – Par échantillonnage sur les données et leurs usages à la recherche et à l’indexation INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 19. 3. 3. AXES D’EVOLUTION Quelques axes d’évolution dans ce nouveau contexte
  • 20. 3. Présentation de 4 axes d’évolution 1. Des listes d’autorité aux répertoires sémantiques  Le cas du Catalogue de la Cité de la Musique 2. Métadonnées composites et choix d’encodage • Les normes du Web  Le cas de la représentation des « langues » (rfc 4646) 3. Convergence et spécificités des modèles  Le cas des modèles éditorial, bibliothéconomique, archivistique et documentaire 4. Accès immédiat aux corpus numériques  Le cas des thèses INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 21. 3.1 #1. Des listes d’autorité aux répertoires sémantiques Le cas du Catalogue de la Cité de la Musique
  • 22. 3.1 Référentiel sémantique (1) INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 23. 3.1 Référentiel sémantique (2) • Schémas de métadonnées – Cohérents et coordonnés • Répertoires contrôlés et enrichis : des ressources – Des entités identifiées (identifiant, uri) – Des entités contrôlées Les Titres de partition, d’œuvres, d’ouvrages, de concerts,… Les Noms des musiciens, compositeurs, éditeurs …. Les Noms des instruments Les Fonctions/Rôles – Des entités enrichies par des attributs Les valeurs de certains attributs sont elles-mêmes contrôlées INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 24. 3.1 Référentiel sémantique (3) • Finalités – Ré-exploitations multiples • Grâce aux Entités - Attributs - Relations – Logiques de recherche/navigation du Web – Optimisation économique • Quelles évolutions ? – Connaissances sur le domaine, plus que catalogue de documents • La Musique à travers ses compositeurs, ses œuvres, ses instruments, ses interprétations,… – Fluidité des liens entre « nœuds » versus rigidité des notices – Offres construites avec des applications composites mêlant des ressources pas toujours homogènes • Interopérabilité structurelle INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 25. 3.2 #2. Métadonnées composites et choix d’encodage Les normes du Web Le cas de la représentation des « langues » (rfc 4646)
  • 26. 3.2 Représentation des langues (1) • Analyse du problème posé – Langue – la langue écrite dans un système d’écriture particulier » la langue chinoise - alphabet chinois ou romanisé (pinyin) – La langue parlée – Dans une région précise du monde » En-UK, En-US, en-CA – Unité traitée – La langue d’un document textuel, d’une mention sur une affiche, du sous-titrage, de leurs traductions, d’annotations.. – Supports plurilangues – Dans le temps – Prise en compte de l’évolution des Pays en particulier – Des langues anciennes – Langues et pays : écriture éponyme » deu et non ger – Règles d’encodage du Web - XHTML, HTML, CSS INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 27. 3.2 Représentation des langues (2) • Métadonnée composite du W3C – Sur la base de la RFC 4646 (Tags for Identifying Languages) – Finalités – Accès direct aux ressources – Répondre précisément aux besoins – Prendre en compte les particularismes régionaux à travers le monde – Intégré à Dubin Core / ISO 15836 zh - Latn - CN [ISO 639-1] [ISO 15924] [ISO 3166] de - CH - 1996 Allemand utilisé en Suisse, écrit après la réforme de l'orthographe entamée en 1996 après J.C. INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 28. 3.2 Représentation des langues (3) • Quelles évolutions ? Jusqu’où aller ? – Représentation et encodage fins d’éléments de donnée appartenant à un schéma de représentation global – La langue telle qu’elle est parlée ou écrite – Mais aussi Contributeur = Personne - Rôle - Date, répétable – Associer des métadonnées à des grains d’information – L’interview d’une personnalité au sein d’une séquence – S’aligne-t-on sur les exigences des technologies du Web ? – accès direct aux ressources, caractère international, précision de la description de tout ou partie des ressources,… INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 29. 3.3 #3. Convergence et spécificités des modèles Le cas des modèles éditorial, bibliothéconomique, archivistique et documentaire
  • 30. 3.3 Modèles documentaires (1) • Points de vue variés sur des objets informationnels ou des activités des Audiences • Critères nombreux • Unité de traitement privilégiée • Résultat : schéma de représentation (notice) • Appartenance à des collections : thématiques, par filiation,… • Structure prise en charge ; interne ou externe à l’objet • Usages de cette représentation (en recherche, avec ou sans outils supplémentaires…) • Reconnaissance (ou pas) de cette méta-structure par les audiences visées • Existence ou pas de formats normalisés (e-books). Existence ou pas d’outils de production INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 31. 3.3 Modèles documentaires (2) A. Structuration orientée par l’objet physique   1. Modélisation éditoriale 2. Modélisation bibliographique B. Structuration orientée par les contenus   3. Modélisation Contenu de premier niveau 4. Modélisation Structurelle de premier niveau 5. Modélisation Genre 6. Modélisation Domaine ou Métier (contexte) 7. Modélisation Collection (contenu/contexte)  INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 32. 3.3 Modèles documentaires (3) 1. Modélisation éditoriale • L’objet pris comme un tout, appartenant à une collection (filiation) • Structure interne visible – supportant la navigation intra-documentaire – Connue par un large public • Formats normalisés (e-book) 2. Modélisation bibliographique • L’objet pris comme un tout, appartenant à une collection (acquisition) • Structure externe à l’objet (notice) – Connue par un large public – N’intègre pas (ou très peu) la sémantique structurelle éditoriale • Formats normalisés INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 33. 3.3 Modèles documentaires (4) 3. Modélisation Contenu de 1er niveau • L’objet pris comme un tout, appartenant à une collection (filiation) • Structure externe à l’objet enrichie de métadonnées d’accès – Offrant une vue synthétique (sujet), mais externe à l’objet – Territoire fixé par l’objet 4. Modélisation Structurelle de 1er niveau • L’unité documentaire est « décrochée » par rapport à l’unité éditoriale ou bibliographique (article, reportage, …) créant après la collection et l’objet, un 3ème niveau • Structure externe à l’objet enrichie de métadonnées d’accès – Offrant des accès analytiques pluriels INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 34. 3.3 Modèles documentaires (5) 5. Modélisation Genre • L’objet pris comme un tout, appartenant à une famille particulière • Structure intra-documentaire prédéterminée par le genre, non formelle – Connue par un public au sein de communautés métiers – Métagenres (compte-rendu de réunion), genres spécialisés – Traduit dans le modèle documentaire par une seule métadonnée 6. Modélisation Domaine ou Métier • Prend appui sur les activités et non spécifiquement les objets • Structure de représentation du domaine, externe aux ressources, indépendante de celles-ci – Connue par les acteurs du domaine et touche un public large au sein du domaine INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 35. 3.3 Modèles documentaires (6) 7. Modélisation Collection – Intégration des objets au sein d’un schéma d’ensemble • Collection éditoriale, d’une bibliothèque, d’un musée, fonds d’une centre documentaire, fonds d’archives • Le référent de cette structure est varié : filiation ou contexte de production , savoir encyclopédique ou domaine spécialisé, activités… Dans un contexte de fédération de ressources (portail), il est possible de rendre convergents ces différents points de vue, tout en conservant les spécificités de chacun. INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 36. 3.3 Modèles documentaires (6) • Granularité de l’unité de traitement choisie INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 37. 3.3 Modèle documentaire générique INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 38. 3.4 #4. Accès immédiat aux corpus numériques Le cas des thèses
  • 39. 3.4 Le cas des thèses (1) • Recommandation TEF de 2006 • « définit un jeu de métadonnées pour les thèses électroniques soutenues en France. • […] a voulu valoriser les thèses françaises grâce à leur diffusion électronique et engager une politique de dépôt et de conservation qui assure leur pérennité. » • Optimiser un circuit éditorial • Postérieur à la création de l’objet • Métadonnées de type bibliographique et administrative Un modèle éditorial post-publication INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 40. 3.4 Le cas des thèses (2) • Améliorer aussi l’exploitation des thèses • Accès immédiat au corpus, lecture non linéaire, parcours, exploitation partielle,… • Insérer des connaissances propres au domaine • Structuration interne de la thèse (genre) – Etat de l’art, méthodologie, modèle, algorithme, architecture, prototype ou étude de cas d’une thèse scientifique – A formaliser dans le jeu de métadonnées • Offrir des possibilités d’indexation sociale par les lecteurs • Adosser ces nouvelles métadonnées au schéma existante • Métadonnée : éditoriale, bibliographique, administrative et de contenu INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 41. 3.4 Le cas des thèses (3) C. Roussey - Une méthode d’indexation • Etat de l’art sur l’indexation dans sémantique adaptée aux corpus multilingues, 2001 Sommaire de la thèse différents types de SRI • Méthode d’indexation proposée Index : modèle des graphes sémantiques, extensions tels thesaurus sémantique, opérateur de projection et algorithmes; annotation et indexation; • Expérimentation Index : prototype SyDOM, bibliothèque (lieu d’exp.), évaluation de l’indexation • Perspective • Terminologie Index : indexation automatique, système de représentation de concepts, ressource linguistique • Article (grain autonome) sur les systèmes de recherche multilingue INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -
  • 42. 4. Conclusion provisoire…
  • 43. 4. Complexité de mise en oeuvre • Malgré les qualités des technologies du Web • Ouverture, interopérabilité technique, normalisation,… • Des difficultés de conception et de mise en œuvre • Normalisation, méthodes et outils : mobilité très grande • Contenu et systèmes ouverts » Penser autrement territoires et périmètres » Articuler différents modèles, schémas et langages » Complexité de la reprise de l’existant » Importance des travaux de modélisation • S’ouvrir aux pratiques et besoins des Utilisateurs » Renouveler l’ ergonomie et les services • Economie des dispositifs et coût des transformations • Accompagner le changement : formation de formateurs Adopter un esprit ouvert et critique INRIA IST - Session introductive sur les métadonnées par Sylvie D 29 Sept 2008 -

Notas do Editor

  1. Interopérabilité : Unicode + [xml] [schema de métadonnées] [langage de concepts]
  2. Métadonnée = représentation + codage Nature : représentation Qualité : réinterprétable Finalité : forme convenant à la communication, l’interprétation ou le traitement Pour l’informatique : dans le cadre des SI, réduction dans la finalité (traitement) Nota 1 : Les données peuvent être traitées par des moyens humains ou automatiques. Nota 2 : Par réinterprétable, on entend que la représentation n&apos;est, en principe, pas utilisable en l&apos;état ». (Afnor XP .X50-435. Sept. 1995. Gestion documentaire - Concepts généraux)
  3. Chapitre 4 - Métadonnées et normalisation Sylvie Dalbin (ATD)
  4. CLaML - http://www.tc215wg3.nhs.uk/pages/docs/presentation_claml.ppt Voir aussi - Chapitre 5 - Des métadonnées à la description des ressources : les langages du web sémantique Bernard Vatant (Mondeca)
  5. Le langage comme moyen d&apos;expression et de représentation Des langages de représentation des SI (systèmes d’information) Représention graphique UML, entité-attribut-classe, Schémas XML Des langages de représentation des ressources Des champs aux schémas de métadonnées Des langages de représentation de concepts Langages documentaires : Thesaurus, classification, taxonomies Des langages pour l’indexation et des langages dédiés à la recherche (thésaurus, ontologies) Des langages de représentation d’instances (identificateurs) Des listes d’autorité aux référentiels sémantiques Insistons sur cet apport du monde de l’ontologie auquel fait référence le Web sémantique qui fait porter plus de poids à la sémantique conceptuelle et contextuelle qu’à la sémantique terminologique (un signe particulier : des termes). =&gt; Des Langages de représentation Métier ou Domaine, représentation d es activités et non des ressources seules =&gt; Repositionner les notions de classes, concepts, « identificateurs » ou entités nommées, sujet
  6. Relations et attributs sont explicités et formalisés Entité = objet pourvu d’une existence propre : un ou des individus (un auteur, une équipe, une société, un gène, etc.), une chose concrète ou abstraite (publication, pays, etc.) ou un événement (commande, manifestation, prescription, etc.). Attribut = Données élémentaires sur une entité (date ou lieu de naissance d’une personne) ou sur une relation. Un des premiers attributs est l’identifiant permettant de nommer ou de désigner de façon non ambiguë, une instance (valeur) de l’entité.
  7. Une personne composant une œuvre sera formellement distinguée de celle interprétant cette œuvre, grâce à un typage des relations [ voir schéma Musique]
  8. Les « langages » sont sous un format et disposés selon une organisation adaptés aux traitements par des machines : langage de recherche multilangages : Otaren ontologie de recherche, base de connaissance = exemple Mondeca. On s’appuie sur l’intelligence emmagasinée dans ces Base de connaissances, thésaurus, ontologie de recherche pour améliorer la recherche. Résoudre les problèmes : -- rapport entre le réseau national et local Voir Aussi - Chapitre 2 - Moteurs de recherche : des enjeux d’aujourd’hui aux moteurs de demain Olivier Ertzscheid (Université de Nantes) - Chapitre 3 - Analyse des usages pour améliorer l’accès aux ressources Anne Boyer (Équipe KIWI – LORIA Université Nancy 2)
  9. Les applications s’auto-référencent ? Elaborer une documentation « informatique » et « métier » Documenter le référentiel des applications Règle de documentation : norme ISO 11179 (MDR) du JTC1 SC32, en cours de révision (eXtended MetaData Registry - XMDR Project) Autres règles : ISO 9735-2:2002 pour les données composites Enregistrer schémas et profils d’application les « agences d’enregistrement  » de l’ISO 11179 Profils d’application: schéma + règle + système d’encodage, tableaux de concordance Reprise du projet au sein du Dublin Core http://dublincore.org/groups/registry
  10. Malgré les qualités des technologies du Web Ouverture, interopérabilité technique, normalisation,…qui « facilitent » la conception et la mise en œuvre des applications informatiques Des difficultés de mise en œuvre des applications Normalisation … trop mobile ! Difficulté à maîtriser la variété des méthodes et outils (schémas) qui se développent (intervention de mardi 30 sept) dans des environnements professionnels différents Articulation de plusieurs schémas et/ou langages dans les portails &gt;&gt;&gt; Les focus ou points de vue adoptés par chaque environnement (métier producteur, Archives, Documentation, Editeur, Bibliothèque, Musée) constituent autant de points de vue différents mais complémentaires sur un même objets Problème d’Interopérabilité sémantique au niveau des éléments de données mais surtout des systèmes d’encodage Une ergonomie fonctionnelle et visuelle à adapter aux besoins, pratiques et usages Articulation complexe avec l’Existant rétro-documentation, pratiques et compétences, logiciels Formation de formateurs Exigence : Un état d’esprit … ouvert ! Une approche nouvelle des ressources numériques et de leurs usages Libérer les métadonnées !
  11. Simples listes contr ôlées permettant la désambiguïsation des concepts : titre des œuvres, titre des documents, titre des concerts, nom des Personnes Ou bien bases de connaissances : Base Concerts, Base Œuvres musicales, … Enrichissement de la recherche : multiples recherches combinées - logiques proches de celle du Web Miles Davis compositeur &gt; Œuvre, puis autre participants aux œuvres … Retrouver des documents d’autres Interprètes des œuvres de Miles Davis Le Catalogue de la Cité de la Musiqu e - http://mediatheque.cite-musique.fr/masc/default.asp?INSTANCE=CITEMUSIQUE
  12. Optimisation économique, Voir aussi : - Chapitre 7 - Méta-information et économie numérique François Moreau (Cnam, Laboratoire d’économétrie)
  13. Voir Aussi - Chapitre 8 - Le futur du web à la lecture des recommandations du W3C Fabien Gandon (Inria)
  14. http://abcdrfc.free.fr/rfc-vf/rfc4646.htm en Français
  15. Finalités Accès direct aux ressources : dans le monde du web, des automates peuvent reconnaître votre profil et vous rerouter automatiquement vers la bonne ressource, sans intermédiaire et sans avoir à mener d’autres actions avec le système Prendre en compte les particularismes régionaux à travers le monde : les systèmes, particulièrement documentaire, sont totalement calés sur le monde occidentale (caractère latin) et plus précisément anglais ou français (les codes des pays sont choisis par rapport à leur forme en anglais) Toutes les langues et groupes de langues : le W3C donne la priorité aux codes terminologiques par rapport aux codes bibliographiques. Intégré à Dublin Core / ISO 15836 - http://dublincore.org/documents/dces)
  16. Des unités de traitement [1, 2, 3, 4, 5] variables suivant les contextes professionnels : unité documentaire, unité bibliographique, unité éditoriale, unité archivistique mais aussi unité d’information (dans un hypertexte, dans un texte, etc.), unité de base, unité d’indexation Représentations des ressources (unités de traitements) et structurations internes variables en fonction des dispositifs Un focus différent qui impact le modèle général des systèmes. A. Structuration orientée par l’objet physique   Modélisation éditoriale Modélisation bibliographique B. Structuration orientée par les contenus   Modélisation Contenu de premier niveau Modélisation Structurelle de premier niveau Modélisation Genre Modélisation Domaine ou Métier (contexte) Modélisation Collection (contenu/contexte) 
  17. Des unités de traitement [1, 2, 3, 4, 5] variables suivant les contextes professionnels : unité documentaire, unité bibliographique, unité éditoriale, unité archivistique mais aussi unité d’information (dans un hypertexte, dans un texte, etc.), unité de base, unité d’indexation Représentations des ressources (unités de traitements) et structurations internes variables en fonction des dispositifs Un focus différent qui impact le modèle général des systèmes. A. Structuration orientée par l’objet physique   Modélisation éditoriale Modélisation bibliographique B. Structuration orientée par les contenus   Modélisation Contenu de premier niveau Modélisation Structurelle de premier niveau Modélisation Genre Modélisation Domaine ou Métier (contexte) Modélisation Collection (contenu/contexte) 
  18. Des unités de traitement [1, 2, 3, 4, 5] variables suivant les contextes professionnels : unité documentaire, unité bibliographique, unité éditoriale, unité archivistique mais aussi unité d’information (dans un hypertexte, dans un texte, etc.), unité de base, unité d’indexation Représentations des ressources (unités de traitements) et structurations internes variables en fonction des dispositifs Un focus différent qui impact le modèle général des systèmes. A. Structuration orientée par l’objet physique   Modélisation éditoriale Modélisation bibliographique B. Structuration orientée par les contenus   Modélisation Contenu de premier niveau Modélisation Structurelle de premier niveau Modélisation Genre Modélisation Domaine ou Métier (contexte) Modélisation Collection (contenu/contexte) 
  19. Voir aussi - Chapitre 6 - Audiovisuel et numérique : la reconstruction éditoriale des contenus Bruno Bachimont (Ina et UTC)
  20. Voir Aussi : - Chapitre 6 - Audiovisuel et numérique : la reconstruction éditoriale des contenus Bruno Bachimont (Ina et UTC)
  21. Malgré les qualités des technologies du Web Ouverture, interopérabilité technique, normalisation,…qui « facilitent » la conception et la mise en œuvre des applications informatiques Des difficultés de mise en œuvre des applications Normalisation … trop mobile ! Difficulté à maîtriser la variété des méthodes et outils (schémas) qui se développent (intervention de mardi 30 sept) dans des environnements professionnels différents Articulation de plusieurs schémas et/ou langages dans les portails &gt;&gt;&gt; Les focus ou points de vue adoptés par chaque environnement (métier producteur, Archives, Documentation, Editeur, Bibliothèque, Musée) constituent autant de points de vue différents mais complémentaires sur un même objets Problème d’Interopérabilité sémantique au niveau des éléments de données mais surtout des systèmes d’encodage Une ergonomie fonctionnelle et visuelle à adapter aux besoins, pratiques et usages Articulation complexe avec l’Existant rétro-documentation, pratiques et compétences, logiciels Formation de formateurs Adopter un état d’esprit … ouvert ! Une approche nouvelle des ressources numériques et de leurs usages Libérer les métadonnées !