SlideShare une entreprise Scribd logo
1  sur  18
Unicas & presse locale ancienne
sont dans une interface…
POUR UNE APPLICATION DE VISUALISATION ET D’EXPLORATION DES
DONNÉES.
Le contexte
Point de départ : valorisation de 2 corpus spécifiques de périodiques :
Unicas et presse locale ancienne
Axe « Valorisation des collections » dans notre convention sur objectifs :
- Évaluer nos collections
- améliorer leur visibilité
- Qualité des données et signalement
Moyen :
- Création et mise en ligne d’un outil de visualisation des données du CR basé sur
les web services du Sudoc
Sudoc
Unicas
Presse locale
Avec ISSN
Sans ISSN
Traduction en langage patate
Presse locale
numérisée
Traduction en Excel
 Fichier des unicas Sudoc  Fichier des titres de presse locale BnF
Traduction en langage graphe (my name is Graph, Property Graph)
Node 2
Node 4
Node 1
Node 5
Node 3
Etapes
- On modélise le graphe (quelles sont les ressources – les nœuds – et quelles sont
leurs relations – connues et à construire - ?)
- On fait un chargement initial de données à minima dans la BDD et on automatise
les enrichissements par des requêtes directement dans le graphe
- On développe l’application au-dessus de la BDD
• pour exposer les données (exports Excel et API)
• pour proposer une interface web de visualisation
Pour bien commencer : déterminer les entités que l’on veut étudier = les nœuds
génériques du graphe
Bibliothèques
Titres unicas
Titres presse
loc. anc.
Titres presse
loc. anc.
numérisés
{Nom,rcr,lat,lon}
{titre,ppn,issn,309}
{titre,ark,issn}
{url,étab}
OWNED_BY
{etatd_de_coll}
HAS_VERSION
Départements
{Nom,numéro}
L
O
C
A
T
E
D
IS_ABOUT
S
A
M
E
_
A
S
Petit aparté : la souplesse d’une modélisation de type Property Graph est aussi sa
principale difficulté
On aurait pu faire complètement différemment… d’ailleurs il n’est pas certain du tout que ce soit
meilleure manière de modéliser.
La question essentielle qui doit guider la structuration interne du graphe est : quelles sont les
questions auxquelles je veux pouvoir répondre ?
Unicas
ppn
issnHAS_ID
Presselocale
HAS_ID
ark
Sudoc
BELONGS_TO
BnFBELONGS_TO
MATCH
Petite mise au point : quand on parle de graphe, on pense web de données et
RDF…
Mais il n’y a pas que le RDF dans la vie !
 RDF
 Triplets sujet-prédicat-objet
 S’appuie sur des uri pour identifier les
ressources, et des ontologies pour
qualifier les ressources et les
prédicats
 A pour objectif de modéliser et
formaliser les données et leurs
connexions selon un standard
 Qui permette leur intégration dans le
web (indexation moteurs de
recherche, accès web, navigation,
échange)
 Un stockage en triple store accessible
par un Endpoint
 Un langage de requête SPARQL
 Propriété de graphe (Graph
Property)
 Des nœuds liés par des relations
 Nœuds et liens peuvent être qualifiés
par des propriétés (formalisées
comme des objets clé-valeur), sans
schéma posé à priori.
 Structuration optimisée pour le
stockage et le parcours de graphe (le
requêtage et la navigation dans les
données)
 Des langages de requêtes selon la
bdd choisie (Neo4j, ArangoDB…)
La problématique classique : obtenir les données
- Où sont les données ?
- Comment les extraire ?
Les sources de données
Bibs de l’ILN 230
https://www.idref.fr/services/iln2rcr/230
Ppn des unicas
Self Sudoc
Site BnF presse loc.
anc.
http://presselocaleancienne.bnf.fr/accueil
Peut mieux faire…
Sudoc web service multiwhere
https://www.sudoc.fr/services/multiwher
e/<ppn>
Sudoc web service
UNIMARC/MARCXML
http://www.sudoc.fr/<ppn>.xml
BnF : SRU
http://catalogue.bnf.fr/api/SRU?version=
1.2&operation=searchRetrieve&query=b
ib.persistentid%20adj%20%22<ark>%22
&recordSchema=unimarcxchange
Sudoc web service issn2ppn
http://www.sudoc.fr/services/issn2ppn/<i
ssn>
Interface web
Client Side
(librairies
JS)
Connexion à
la BDD
Graphe
Distribution des données
Server side
(Express) :
API
Données
Json + doc
SWagger
BDD/ETL Neo4j
node
1
node
5
node
2
node
3
node
4
Client side :
Exploitation
API
Tableaux
Widgets
Pour en savoir plus
Liens vers les billets de blogs (passés et à venir)
http://bibliotheque-blogs.unice.fr/sudoc-ps/
http://bibliotheque-blogs.unice.fr/sudoc-ps/tag/valorisation-des-collections/
Code source
Le code de l’application sera disponible en open source dès que l’application sera finalisée (à
la rentrée universitaire 2019).
En attendant :
- https://github.com/gegedenice/angular-sudocps-unicas : pour créer une page web listant
vos unicas (voir par exemple l’adaptation du code par le CR Rhône-Alpes https://bu.univ-
grenoble-alpes.fr/CR69/index.html).
- https://gist.github.com/gegedenice/c7e53cc4c3d65b8bc1639d4b55a90be6 : un gist avec
les requêtes en langage Cypher utilisées pour charger et enrichir les données dans Neo4j.
Nous contacter
Sudocps-scd@unice.fr
geoffroy@unice.fr

Contenu connexe

Similaire à Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale)

Distributed computing with Spark 2.x
Distributed computing with Spark 2.xDistributed computing with Spark 2.x
Distributed computing with Spark 2.xDr Hajji Hicham
 
Concevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligneConcevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligneNahid Oulmi
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDAnonue12
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)Abdelkader OUARED
 
Les éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EADLes éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EADDanis Habib
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech
 
Text mining pour industrie
Text mining pour industrieText mining pour industrie
Text mining pour industrieAli Kabbadj
 
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Fabien Gandon
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsMICHRAFY MUSTAFA
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked dataVincentBroute
 
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...Fabien Gandon
 
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBRomain Cambien
 
JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgJABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgABES
 
Cartographie de l'information
Cartographie de l'informationCartographie de l'information
Cartographie de l'informationlaureno
 
Une introduction au web de données
Une introduction au web de donnéesUne introduction au web de données
Une introduction au web de donnéesYannick Prié
 
cours06-nosql.pdf
cours06-nosql.pdfcours06-nosql.pdf
cours06-nosql.pdfhbadir
 
La caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informationsLa caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informationsChristopheTricot
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de donnéesAbdoulaye Dieng
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueAntidot
 

Similaire à Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale) (20)

Distributed computing with Spark 2.x
Distributed computing with Spark 2.xDistributed computing with Spark 2.x
Distributed computing with Spark 2.x
 
Concevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligneConcevoir un outil d'analyse de réseau en ligne
Concevoir un outil d'analyse de réseau en ligne
 
CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDA
 
A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)A Brief History of Database Management (SQL, NoSQL, NewSQL)
A Brief History of Database Management (SQL, NoSQL, NewSQL)
 
Les éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EADLes éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EAD
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
 
Text mining pour industrie
Text mining pour industrieText mining pour industrie
Text mining pour industrie
 
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
Les technologies du web, les standards de l'innovation ouverte : état de l'ar...
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & Actions
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
 
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
 
JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de StrasbourgJABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
 
Cartographie de l'information
Cartographie de l'informationCartographie de l'information
Cartographie de l'information
 
Une introduction au web de données
Une introduction au web de donnéesUne introduction au web de données
Une introduction au web de données
 
cours06-nosql.pdf
cours06-nosql.pdfcours06-nosql.pdf
cours06-nosql.pdf
 
La caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informationsLa caisse à outils de la visualisation d'informations
La caisse à outils de la visualisation d'informations
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
 
Moteurs de recherche et web sémantique
Moteurs de recherche et web sémantiqueMoteurs de recherche et web sémantique
Moteurs de recherche et web sémantique
 

Dernier

Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesMohammedAmineHatoch
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsJaouadMhirach
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxrajaakiass01
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxabdououanighd
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...Universidad Complutense de Madrid
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Technologia Formation
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxShinyaHilalYamanaka
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkRefRama
 
658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdfMariaClaraAlves46
 
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfSTRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfGamal Mansour
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxikospam0
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 

Dernier (20)

Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénients
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf
 
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfSTRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 

Journée Sudoc-PS 2019, application de visualisation de corpus de périodiques (unicas & presse locale)

  • 1. Unicas & presse locale ancienne sont dans une interface… POUR UNE APPLICATION DE VISUALISATION ET D’EXPLORATION DES DONNÉES.
  • 2. Le contexte Point de départ : valorisation de 2 corpus spécifiques de périodiques : Unicas et presse locale ancienne Axe « Valorisation des collections » dans notre convention sur objectifs : - Évaluer nos collections - améliorer leur visibilité - Qualité des données et signalement Moyen : - Création et mise en ligne d’un outil de visualisation des données du CR basé sur les web services du Sudoc
  • 3. Sudoc Unicas Presse locale Avec ISSN Sans ISSN Traduction en langage patate Presse locale numérisée
  • 4. Traduction en Excel  Fichier des unicas Sudoc  Fichier des titres de presse locale BnF
  • 5. Traduction en langage graphe (my name is Graph, Property Graph) Node 2 Node 4 Node 1 Node 5 Node 3 Etapes - On modélise le graphe (quelles sont les ressources – les nœuds – et quelles sont leurs relations – connues et à construire - ?) - On fait un chargement initial de données à minima dans la BDD et on automatise les enrichissements par des requêtes directement dans le graphe - On développe l’application au-dessus de la BDD • pour exposer les données (exports Excel et API) • pour proposer une interface web de visualisation
  • 6. Pour bien commencer : déterminer les entités que l’on veut étudier = les nœuds génériques du graphe Bibliothèques Titres unicas Titres presse loc. anc. Titres presse loc. anc. numérisés {Nom,rcr,lat,lon} {titre,ppn,issn,309} {titre,ark,issn} {url,étab} OWNED_BY {etatd_de_coll} HAS_VERSION Départements {Nom,numéro} L O C A T E D IS_ABOUT S A M E _ A S
  • 7. Petit aparté : la souplesse d’une modélisation de type Property Graph est aussi sa principale difficulté On aurait pu faire complètement différemment… d’ailleurs il n’est pas certain du tout que ce soit meilleure manière de modéliser. La question essentielle qui doit guider la structuration interne du graphe est : quelles sont les questions auxquelles je veux pouvoir répondre ? Unicas ppn issnHAS_ID Presselocale HAS_ID ark Sudoc BELONGS_TO BnFBELONGS_TO MATCH
  • 8. Petite mise au point : quand on parle de graphe, on pense web de données et RDF… Mais il n’y a pas que le RDF dans la vie !  RDF  Triplets sujet-prédicat-objet  S’appuie sur des uri pour identifier les ressources, et des ontologies pour qualifier les ressources et les prédicats  A pour objectif de modéliser et formaliser les données et leurs connexions selon un standard  Qui permette leur intégration dans le web (indexation moteurs de recherche, accès web, navigation, échange)  Un stockage en triple store accessible par un Endpoint  Un langage de requête SPARQL  Propriété de graphe (Graph Property)  Des nœuds liés par des relations  Nœuds et liens peuvent être qualifiés par des propriétés (formalisées comme des objets clé-valeur), sans schéma posé à priori.  Structuration optimisée pour le stockage et le parcours de graphe (le requêtage et la navigation dans les données)  Des langages de requêtes selon la bdd choisie (Neo4j, ArangoDB…)
  • 9. La problématique classique : obtenir les données - Où sont les données ? - Comment les extraire ?
  • 10. Les sources de données Bibs de l’ILN 230 https://www.idref.fr/services/iln2rcr/230 Ppn des unicas Self Sudoc Site BnF presse loc. anc. http://presselocaleancienne.bnf.fr/accueil
  • 11. Peut mieux faire… Sudoc web service multiwhere https://www.sudoc.fr/services/multiwher e/<ppn> Sudoc web service UNIMARC/MARCXML http://www.sudoc.fr/<ppn>.xml BnF : SRU http://catalogue.bnf.fr/api/SRU?version= 1.2&operation=searchRetrieve&query=b ib.persistentid%20adj%20%22<ark>%22 &recordSchema=unimarcxchange Sudoc web service issn2ppn http://www.sudoc.fr/services/issn2ppn/<i ssn>
  • 12. Interface web Client Side (librairies JS) Connexion à la BDD Graphe Distribution des données Server side (Express) : API Données Json + doc SWagger BDD/ETL Neo4j node 1 node 5 node 2 node 3 node 4 Client side : Exploitation API Tableaux Widgets
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18. Pour en savoir plus Liens vers les billets de blogs (passés et à venir) http://bibliotheque-blogs.unice.fr/sudoc-ps/ http://bibliotheque-blogs.unice.fr/sudoc-ps/tag/valorisation-des-collections/ Code source Le code de l’application sera disponible en open source dès que l’application sera finalisée (à la rentrée universitaire 2019). En attendant : - https://github.com/gegedenice/angular-sudocps-unicas : pour créer une page web listant vos unicas (voir par exemple l’adaptation du code par le CR Rhône-Alpes https://bu.univ- grenoble-alpes.fr/CR69/index.html). - https://gist.github.com/gegedenice/c7e53cc4c3d65b8bc1639d4b55a90be6 : un gist avec les requêtes en langage Cypher utilisées pour charger et enrichir les données dans Neo4j. Nous contacter Sudocps-scd@unice.fr geoffroy@unice.fr