SlideShare uma empresa Scribd logo
1 de 37
Baixar para ler offline
Mettre nos données en réseau

         Yann NICOLAS
          ADBU 2009
Les données. Un enjeu politique
“Searchability and data formats are a problem in
 a large number of member states.
 Search functions are hard to use in several
 countries. In some countries they are non-
 existent.”

 “Several countries do provide the whole data in
 a CSV or XLS or other format – and this is
 welcomed as good practice. Many countries do
 not and worse still, a few countries appear to
 have designed their websites with the deliberate
 aim of obstructing screen scrapers.”
farmsubsidy.org , Evaluation of the implementation of transparency in CAP beneficiaries. Mai 2009
Association pour la transparence des données publiques

Va chercher les données « publiques », les nettoie, les
agrège, les republie, les rend exploitables par des
programmes informatiques(API)

Courtier ? Activiste ? Pirate ?
VERS
    UNE POLITIQUE PUBLIQUE
         DES DONNÉES


En général
Des données de l’IST en particulier

Fondée sur quels principes ?
MÉTADONNÉES = DONNÉES

 DONNÉES = MÉTADONNÉES

Métadonnées = informations sur des documents ?
Nos métadonnées parlent de tout. Ex: portail des
thèses
Les métadonnées sont partout – et pas seulement
dans les métiers de la doc.
SC2D

Service Commun de la Documentation et des Données
WEB DE DOCUMENTS
                        VS
            WEB DE DONNÉES

Le Web est une collection de documents (HTML,
PDF…)

Le Web devient une collection de bases de données
(RDF, RDFa)
hier   aujourd’hui   demain
Données




                                                 Page HTML



 LE CONTENU DES DONNÉES EST
UTILISÉ DANS UN DOCUMENT HTML

Le Document HTML est fait pour être lu par des
humains ;
pas pour être exploité par des programmes
hier   aujourd’hui   demain
Page HTML


  Données




                                                     HTML + RDFa


   LES DONNÉES SONT PRÉSENTES
     DANS LE DOCUMENT HTML


Le Document HTML + RDFa peut être lu par des humains et
exploité par des programmes
La base de données est dans le Web, pas sous le Web (deep Web)
<div>
   <span>Date : </span>
   <span content="1601/1700" property="dc:date">XVII<sup>e</sup>
siècle</span>
</div>


<http://www.calames.abes.fr/pub/ms/res/MAZB10378> <dc:date> "1601/1700"
AVEC RDFa, LES DONNÉES DE
  CALAMES SONT DANS LA BASE DE
        YAHOO, SINDICE…

On parle bien des données dans toute leur richesse !

RDFa est désormais supporté par les « grossistes » du
Web : Google, Yahoo.
HTTP://BOSS.YAHOOAPIS.COM/YSEARCH/WEB/V1/"ALGRIN SIT
                E: CALAMES.ABES.FR…




On peut accéder aux données de Calames à
travers les services de Yahoo
 Un tiers peut refaire Calames à partir de Yahoo
LE WEB DES DONNÉES DOIT AUSSI
     CONCERNER L’INFORMATION
    SCIENTIFIQUE, TECHNIQUE ET
                PATRIMONIALE
Pas seulement les produits commerciaux, les congrès,
les vidéos…
Cibles : Sudoc, HAL, Star, Bases CNRS, Persée,
Revues.org,…
POUR UN SERVICES PUBLIC DES
              DONNÉES BRUTES

         LAISSER LES AUTRES LES
                   RÉUTILISER

Exposer les données « à la cantonade »
On ignore à qui, à quoi elles peuvent servir
Permettre à d’autres de les réutiliser
Usages nouveaux, variés, spécialisés. Visualisations.
Combinaisons de différents corpus (mashups)
Contre les monopoles privés et les monopoles publics
LIER LES DONNÉES ENTRE ELLES

                 LINKED DATA


Le Web comme collection de base de données ?
Ou le Web comme base de données ?
 Interconnecter les bases
2 BASES DE DONNÉES EN RDF
     DÉCRIVENT LA MÊME PERSONNE

Base RDF accessible en ligne   Identifiant de Tricky (URL)


Dbpedia (Wikipedia en RDF)     http://dbpedia.org/resource/Tricky


BBC Music                      http://www.bbc.co.uk/music/artists/5bf64d94-
                               efd9-4334-96fd-e6197b0b02b8#artist
CONNECTER LES DEUX BASES RDF
 http://www.bbc.co.uk/music/artists/5bf64d
 94-efd9-4334-96fd-e6197b0b02b8#artist

       owl:sameAs

 http://dbpedia.org/resource/Tricky




Les informations des deux bases peuvent fusionner
C’est le principe d’un Web de données liées
COMMENT INTERCONNECTER LES
       BASES DE L’ABES ?
      DE L’IST FRANÇAISE ?


Aligner les identifiants des uns et des autres (avec
owl:sameAs) ?
Mieux : si possible, partager à la source les mêmes
identifiants
LES AUTORITÉS SUDOC,
            AU-DELÀ DU SUDOC



Normaliser les noms de personne en les liant aux autorités Sudoc,
pour :
       . Star
       . Calames
       . Persée
       . ORI-OAI
       . Adonis
       .?
POURQUOI SE LIER AUX AUTORITÉS
           SUDOC ?



Qualité interne de chaque base *
Economies d’échelle *
Enrichir chaque base avec les informations des autres ***
A terme, permettre des requêtes et des explorations plus riches ***
2006 –

   STAR ET CALAMES INTERROGENT
  LES AUTORITÉS SUDOC EN Z 39.50

Solution provisoire
Limitations :
       . Performances
       . Index limités
       . Et quand la notice d’autorité n’existe pas ?
2010 T1

     LES AUTORITÉS SUDOC COMME
          SERVICE PUBLIC
   POUR LES APPLICATIONS TIERCES


Lire et écrire !
Comme le réseau électrique ? Contribuer (solaire) et recevoir
Production décentralisée
Consommation décentralisée
2010
T1
2010-2011

        LES AUTORITÉS SUDOC AU
        SERVICE DU MÉTA-PORTAIL
                ADONIS
                  (SI FINANCEMENT   CONFIRMÉ)

Méta-portail = risque de l’auberge espagnole
Les autorités Sudoc comme pivot
Harmoniser en masse les noms du méta-portail
Avec les technologies du Web sémantique (RDF, ontologies,
règles)
Avec le CNRS : équipe RCR du laboratoire LIRMM (Mtpellier)
DANS LE CADRE DU PROJET AVEC
          ADONIS,

    Corpus de                             Lien aux
   métadonnées à                          autorités
      enrichir


            Données enrichies du lien aux autorités


L’UTILISATION DES TECHNOLOGIES
    SÉMANTIQUE EST INTERNE
DEMAIN

  LINKED DATA DE L’IST FRANÇAIS ?


Linked data : données ouvertes et liées
OUVRIR n’est pas le plus compliqué (sauf contraintes juridiques)
Le plus dur est de LIER - d’où l’importance des autorités

Ne suppose pas un Plan quinquennal centralisé
« Coopération décentralisée » des données
ABES
Département Etudes & Projets

nicolas@abes.fr

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
2015 ed spi
2015 ed spi2015 ed spi
2015 ed spi
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 
RDF en quelques slides
RDF en quelques slidesRDF en quelques slides
RDF en quelques slides
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
 
Linked open data pour la consommation des informations
Linked open data pour la consommation des informationsLinked open data pour la consommation des informations
Linked open data pour la consommation des informations
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèques
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de données
 
Jabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de donnéesJabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de données
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
 
Découverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALDécouverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HAL
 
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesInteropérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 

Destaque (20)

Kit thesaurus
Kit thesaurusKit thesaurus
Kit thesaurus
 
La educación parvularia en chile 2
La educación parvularia en chile 2La educación parvularia en chile 2
La educación parvularia en chile 2
 
Criptografía
CriptografíaCriptografía
Criptografía
 
Las estaciones del año
Las estaciones del añoLas estaciones del año
Las estaciones del año
 
Minitutorial calc
Minitutorial calcMinitutorial calc
Minitutorial calc
 
Elplagio
ElplagioElplagio
Elplagio
 
6 issuu avila
6 issuu avila6 issuu avila
6 issuu avila
 
La révolution du Big data
La révolution du Big dataLa révolution du Big data
La révolution du Big data
 
P D F
P D FP D F
P D F
 
Simon esperanza contexto historico del positivismo
Simon esperanza   contexto historico del positivismoSimon esperanza   contexto historico del positivismo
Simon esperanza contexto historico del positivismo
 
Conjunto s
Conjunto sConjunto s
Conjunto s
 
Trabajo reli
Trabajo reliTrabajo reli
Trabajo reli
 
Copia de presentación1
Copia de presentación1Copia de presentación1
Copia de presentación1
 
Misa papa francisco en quito
Misa papa francisco en quitoMisa papa francisco en quito
Misa papa francisco en quito
 
Taller de con filminas de liderazgo
Taller de con filminas de liderazgoTaller de con filminas de liderazgo
Taller de con filminas de liderazgo
 
Presentación. La sociedad de la comunicación.
Presentación. La sociedad de la comunicación.Presentación. La sociedad de la comunicación.
Presentación. La sociedad de la comunicación.
 
Carnegie tuesday 19 april
Carnegie tuesday 19 aprilCarnegie tuesday 19 april
Carnegie tuesday 19 april
 
Conocetu higado
Conocetu higadoConocetu higado
Conocetu higado
 
Cuadros y poemas
Cuadros y poemasCuadros y poemas
Cuadros y poemas
 
Copia de presentación1
Copia de presentación1Copia de presentación1
Copia de presentación1
 

Semelhante a Mettre nos données en réseau (données de l'IST en France)

Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
Bibliolab
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
Gregoire Burel
 
Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étages
SemWebPro
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011
Sylvain Machefert
 
Introduction aux RDF & SPARQL
Introduction aux RDF & SPARQLIntroduction aux RDF & SPARQL
Introduction aux RDF & SPARQL
Open Data Support
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
Ivan Herman
 

Semelhante a Mettre nos données en réseau (données de l'IST en France) (20)

Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQL
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Isidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de données
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
 
Armadillo - Web sémantique, les outils d’un open data culturel
Armadillo  - Web sémantique, les outils d’un open data culturelArmadillo  - Web sémantique, les outils d’un open data culturel
Armadillo - Web sémantique, les outils d’un open data culturel
 
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
 
ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)
 
Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étages
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011
 
Introduction aux RDF & SPARQL
Introduction aux RDF & SPARQLIntroduction aux RDF & SPARQL
Introduction aux RDF & SPARQL
 
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Web 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & WikisWeb 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & Wikis
 
Introduction à Linked Data
Introduction à Linked DataIntroduction à Linked Data
Introduction à Linked Data
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
 

Mais de Y. Nicolas

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
Y. Nicolas
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
Y. Nicolas
 

Mais de Y. Nicolas (17)

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
 
web de données / bib
web de données / bibweb de données / bib
web de données / bib
 
Jabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de donnéesJabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de données
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Le Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnéesLe Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnées
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 

Último

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 

Último (16)

RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 

Mettre nos données en réseau (données de l'IST en France)

  • 1. Mettre nos données en réseau Yann NICOLAS ADBU 2009
  • 2. Les données. Un enjeu politique
  • 3.
  • 4. “Searchability and data formats are a problem in a large number of member states. Search functions are hard to use in several countries. In some countries they are non- existent.” “Several countries do provide the whole data in a CSV or XLS or other format – and this is welcomed as good practice. Many countries do not and worse still, a few countries appear to have designed their websites with the deliberate aim of obstructing screen scrapers.” farmsubsidy.org , Evaluation of the implementation of transparency in CAP beneficiaries. Mai 2009
  • 5. Association pour la transparence des données publiques Va chercher les données « publiques », les nettoie, les agrège, les republie, les rend exploitables par des programmes informatiques(API) Courtier ? Activiste ? Pirate ?
  • 6. VERS UNE POLITIQUE PUBLIQUE DES DONNÉES En général Des données de l’IST en particulier Fondée sur quels principes ?
  • 7. MÉTADONNÉES = DONNÉES DONNÉES = MÉTADONNÉES Métadonnées = informations sur des documents ? Nos métadonnées parlent de tout. Ex: portail des thèses Les métadonnées sont partout – et pas seulement dans les métiers de la doc.
  • 8. SC2D Service Commun de la Documentation et des Données
  • 9. WEB DE DOCUMENTS VS WEB DE DONNÉES Le Web est une collection de documents (HTML, PDF…) Le Web devient une collection de bases de données (RDF, RDFa)
  • 10. hier aujourd’hui demain
  • 11. Données Page HTML LE CONTENU DES DONNÉES EST UTILISÉ DANS UN DOCUMENT HTML Le Document HTML est fait pour être lu par des humains ; pas pour être exploité par des programmes
  • 12. hier aujourd’hui demain
  • 13. Page HTML Données HTML + RDFa LES DONNÉES SONT PRÉSENTES DANS LE DOCUMENT HTML Le Document HTML + RDFa peut être lu par des humains et exploité par des programmes La base de données est dans le Web, pas sous le Web (deep Web)
  • 14.
  • 15. <div> <span>Date : </span> <span content="1601/1700" property="dc:date">XVII<sup>e</sup> siècle</span> </div> <http://www.calames.abes.fr/pub/ms/res/MAZB10378> <dc:date> "1601/1700"
  • 16. AVEC RDFa, LES DONNÉES DE CALAMES SONT DANS LA BASE DE YAHOO, SINDICE… On parle bien des données dans toute leur richesse ! RDFa est désormais supporté par les « grossistes » du Web : Google, Yahoo.
  • 17. HTTP://BOSS.YAHOOAPIS.COM/YSEARCH/WEB/V1/"ALGRIN SIT E: CALAMES.ABES.FR… On peut accéder aux données de Calames à travers les services de Yahoo  Un tiers peut refaire Calames à partir de Yahoo
  • 18. LE WEB DES DONNÉES DOIT AUSSI CONCERNER L’INFORMATION SCIENTIFIQUE, TECHNIQUE ET PATRIMONIALE Pas seulement les produits commerciaux, les congrès, les vidéos… Cibles : Sudoc, HAL, Star, Bases CNRS, Persée, Revues.org,…
  • 19. POUR UN SERVICES PUBLIC DES DONNÉES BRUTES LAISSER LES AUTRES LES RÉUTILISER Exposer les données « à la cantonade » On ignore à qui, à quoi elles peuvent servir Permettre à d’autres de les réutiliser Usages nouveaux, variés, spécialisés. Visualisations. Combinaisons de différents corpus (mashups) Contre les monopoles privés et les monopoles publics
  • 20. LIER LES DONNÉES ENTRE ELLES LINKED DATA Le Web comme collection de base de données ? Ou le Web comme base de données ?  Interconnecter les bases
  • 21.
  • 22.
  • 23.
  • 24. 2 BASES DE DONNÉES EN RDF DÉCRIVENT LA MÊME PERSONNE Base RDF accessible en ligne Identifiant de Tricky (URL) Dbpedia (Wikipedia en RDF) http://dbpedia.org/resource/Tricky BBC Music http://www.bbc.co.uk/music/artists/5bf64d94- efd9-4334-96fd-e6197b0b02b8#artist
  • 25. CONNECTER LES DEUX BASES RDF http://www.bbc.co.uk/music/artists/5bf64d 94-efd9-4334-96fd-e6197b0b02b8#artist owl:sameAs http://dbpedia.org/resource/Tricky Les informations des deux bases peuvent fusionner C’est le principe d’un Web de données liées
  • 26. COMMENT INTERCONNECTER LES BASES DE L’ABES ? DE L’IST FRANÇAISE ? Aligner les identifiants des uns et des autres (avec owl:sameAs) ? Mieux : si possible, partager à la source les mêmes identifiants
  • 27. LES AUTORITÉS SUDOC, AU-DELÀ DU SUDOC Normaliser les noms de personne en les liant aux autorités Sudoc, pour : . Star . Calames . Persée . ORI-OAI . Adonis .?
  • 28. POURQUOI SE LIER AUX AUTORITÉS SUDOC ? Qualité interne de chaque base * Economies d’échelle * Enrichir chaque base avec les informations des autres *** A terme, permettre des requêtes et des explorations plus riches ***
  • 29.
  • 30. 2006 – STAR ET CALAMES INTERROGENT LES AUTORITÉS SUDOC EN Z 39.50 Solution provisoire Limitations : . Performances . Index limités . Et quand la notice d’autorité n’existe pas ?
  • 31. 2010 T1 LES AUTORITÉS SUDOC COMME SERVICE PUBLIC POUR LES APPLICATIONS TIERCES Lire et écrire ! Comme le réseau électrique ? Contribuer (solaire) et recevoir Production décentralisée Consommation décentralisée
  • 33. 2010-2011 LES AUTORITÉS SUDOC AU SERVICE DU MÉTA-PORTAIL ADONIS (SI FINANCEMENT CONFIRMÉ) Méta-portail = risque de l’auberge espagnole Les autorités Sudoc comme pivot Harmoniser en masse les noms du méta-portail Avec les technologies du Web sémantique (RDF, ontologies, règles) Avec le CNRS : équipe RCR du laboratoire LIRMM (Mtpellier)
  • 34. DANS LE CADRE DU PROJET AVEC ADONIS, Corpus de Lien aux métadonnées à autorités enrichir Données enrichies du lien aux autorités L’UTILISATION DES TECHNOLOGIES SÉMANTIQUE EST INTERNE
  • 35. DEMAIN LINKED DATA DE L’IST FRANÇAIS ? Linked data : données ouvertes et liées OUVRIR n’est pas le plus compliqué (sauf contraintes juridiques) Le plus dur est de LIER - d’où l’importance des autorités Ne suppose pas un Plan quinquennal centralisé « Coopération décentralisée » des données
  • 36.
  • 37. ABES Département Etudes & Projets nicolas@abes.fr