SlideShare uma empresa Scribd logo
1 de 30
Baixar para ler offline
SHARE CATALOGUE:
le biblioteche universitarie in Linked Open Data
Roberto delle Donne (Università degli Studi di Napoli Federico II)
Tiziana Possemato (@Cult)
Copyright 2008 @CULT. All rights reserved
SHARE
Scholarly Heritage and Access to Research
Il catalogo presentato rientra in un vasto progetto di cooperazione e condivisione di
servizi tra biblioteche campane, lucane e salentine denominato SHARE (Scholarly
Heritage and Access to Research), che include, con diversi livelli di collaborazione:
• adozione di un modello organizzativo improntato alla cooperazione;
• accesso integrato all’informazione bibliografica e documentale relativa alle
rispettive collezioni analogiche e digitali;
• realizzazione di piattaforme comuni per l’editoria digitale:
• SHARE Press
• SHARE Journals
• SHARE Books
• SHARE Open Archive
2/26
Copyright 2008 @CULT. All rights reserved
Il progetto SHARE Catalogue
Il progetto SHARE Catalogue propone il trattamento per la conversione in linked
open data, la pubblicazione su differenti siti e portali open data, la costruzione di
un portale unico per la fruizione dei dati dei Cataloghi bibliografici e di autorità
delle Università partecipanti:
• Università degli Studi di Napoli Federico II (Napoli)
• Università degli Studi di Napoli L’Orientale (Napoli)
• Università degli Studi Napoli Parthenope (Napoli)
• Università degli Studi di Salerno (Salerno)
• Università degli Studi del Sannio (Benevento)
• Università degli Studi della Basilicata (Potenza)
• Università degli Studi del Salento (Lecce)
3/26
Copyright 2008 @CULT. All rights reserved
Il progetto SHARE Catalogue – Scopo
Scopo del progetto: integrare la notevole base di conoscenza
rappresentata dai differenti Cataloghi di authority e bibliografici, per
arricchirla con quella nuova e in divenire generata dal WEB e costruire
un sistema informativo integrato per offrire agli utenti uno strumento
unico di accesso ai vari OPAC delle Biblioteche.
4/26
Copyright 2008 @CULT. All rights reserved
SHARE Catalogue - Obiettivi
Obiettivi del progetto: distinti in linee differenti ma complementari:
• conversione dei dati secondo il modello di riferimento indicato dal
W3C standard per i Linked Open Data, RDF – Resource Description
Framework;
• creazione di una struttura di dati basata su registrazioni distinte per
le entità Persone e Opere, definite dal modello BIBFRAME;
• arricchimento dei dati tramite il collegamento a progetti esterni,
relativi soprattutto ad Authority file e enciclopedie online (es.: VIAF,
Library of Congress Name Authority file, ISNI, Wikipedia, Wikidata, …).
5/26
Copyright 2008 @CULT. All rights reserved
SHARE Catalogue - Obiettivi
• pubblicazione del dataset sui siti preposti ad accogliere dati in linked
open data (CKAN, etc.), con licenza Creative Commons;
• costruzione di un portale di consultazione, dotato di un’interfaccia di
navigazione semplice ed intuitiva, basata sul nuovo modello di dati
BIBFRAME – Bibliographic Framework Initiative.
6/26
Copyright 2008 @CULT. All rights reserved
BIBFRAME – Bibliographic Framework Initiative
Il documento Bibliographic Framework as a Web of Data: Linked Data Model
and Supporting Services, pubblicato dalla Library of Congress il 21 novembre
2012, espone un nuovo modello di dati pensato come evoluzione, in linked open
data, del formato Marc 21.
Le riflessioni sulle nuove norme catalografiche si focalizzano su alcuni punti specifici,
tra cui:
• maggior livello di identificazione e analisi del dato;
• più attenzione ai vocabolari controllati;
• maggior uso dei termini rispetto a codici;
• enfasi sulle relazioni;
• maggiore flessibilità nelle voci controllate.
7/26
Copyright 2008 @CULT. All rights reserved
BIBFRAME – Bibliographic Framework Initiative
Il modello BIBFRAME è organizzato in 4 classi principali:
• Opera
- l’essenza concettuale del documento catalogato;
- assimilabile all’opera e alla espressione del modello FRBR.
• Istanza
- una materializzazione individuale dell’opera.
• Authority
- un concetto chiave d’autorità che abbia una relazione con l’opera o con l’istanza (es.
Persone, luoghi, Concetti, Organizzazioni).
• Annotazioni
- Elementi e risorse che decorano e/o arricchiscono le altre risorse del modello
BIBFRAME con informazioni aggiuntive (es. holding, immagini di copertina,
recensioni, …).
8/26
Copyright 2008 @CULT. All rights reserved
BIBFRAME – Bibliographic Framework Initiaitve
La decisione di orientare un progetto di integrazione di dati provenienti da
differenti cataloghi alle tecnologie del web semantico e dei linked open data è
sostenuta da un’ampia letteratura che ne definisce il potenziale e la ricchezza.
L’obiettivo dunque non è solo facilitare l’interazione, lo scambio e il riutilizzo delle
informazioni tra sistemi informativi non omogenei (in termini di sw e di hw),
ma soprattutto offrire benefici di sicuro interesse tanto per il gestore della
base di conoscenza (i bibliotecari), quanto per gli utenti finali.
9/26
Copyright 2008 @CULT. All rights reserved
Descrizione generale dei cataloghi
I dati catalografici considerati nel progetto derivano da tre LMS differenti (Aleph,
Sebina e Millennium) e sono strutturati in Unimarc e Marc 21.
Tipologie di dati considerate nel progetto:
• la base dati bibliografica (record bibliografici);
• la base dati di autorità (authority file).
Nell’analisi dei dati originali particolare attenzione è stata posta agli elementi e
alle pratiche catalografiche comuni nei differenti cataloghi, per individuarne
punti di contatto tra le varie fonti ed elementi di diversità e di difformità.
10/26
Copyright 2008 @CULT. All rights reserved
Descrizione generale dei cataloghi
Risultati dell’indagine conoscitiva:
- un uso scarso o comunque non diffuso di attributi utili alla identificazione delle
entità Opera e Espressione;
- pochi record corredati da un punto di accesso autorizzato per il titolo (quello
che le REICAT definiscono il “titolo uniforme”), o da elementi quali il titolo
originale per identificare una Espressione.
11/26
Copyright 2008 @CULT. All rights reserved
Descrizione generale dei cataloghi
Questa prima osservazione dei dati ha suggerito un altro percorso di analisi:
- studio delle entità “Persona-Famiglia-Ente” con i relativi attributi: analisi degli
elementi relativi al creatore o ai creatori di un’opera analizzati, principalmente,
sui due authority file provenienti dall’Università Federico II e dall’Università
della Basilicata.
- comparazione di una medesima entità Persona* registrata sui differenti
cataloghi, al fine di analizzare le pratiche catalografiche di ciascuna biblioteca
e l’uniformità (o difformità) nella scelta dei punti di accesso.
(* Si intende da ora in avanti per Persona un’entità del tipo Persona/Famiglia/Ente)
12/26
Copyright 2008 @CULT. All rights reserved
Arricchimento delle entità FRBR/BIBFRAME
Obiettivo di una successiva fase di lavoro è stato quello di realizzare, attraverso
l’utilizzo di API, web service e SPARQL endpoint messi a disposizione da fonti
esterne al catalogo, un arricchimento dei dati attraverso la creazione di un
“grappolo” (cluster) di forme utilizzate nei differenti cataloghi e provenienti
dall’esterno, per ciascuna entità, e dunque:
• cluster dei nomi – le forme, autorizzate e varianti, dei nomi delle Persone;
• cluster dei titoli – punto di accesso autorizzato e forme varianti per i titoli
delle Opere.
13/26
Copyright 2008 @CULT. All rights reserved
Costruzione del cluster Persona
Arricchimento dei dati di origine tramite il VIAF: per ogni entità Persona
sono recuperate dal VIAF tutte le forme attraverso le quali può essere
rappresentato il dato ricercato. L’arricchimento del dato originario avviene in
differenti step:
• estrazione, dagli authority file delle biblioteche, della forma autorizzata e delle
forme varianti del nome;
• estrazione, dai record catalografici, dei campi in cui è registrato l’elemento
creatore/creatori;
• confronto diretto dei punti di accesso così ottenuti con le forme presenti sul
VIAF, strutturate a grappolo;
• creazione del grappolo finale con tutte le forme del nome relazionate e
associate ad un unico identificatore locale.
14/26
Copyright 2008 @CULT. All rights reserved
Il cluster Persona
Risultato di un grappolo o cluster
Persona per l’entità Richard von
Mises, con le differenti forme del
nome provenienti da:
• Authority file
• VIAF
• Rinvii (da record di authority)
• Forme utilizzate nei record
bibliografici
15/26
Copyright 2008 @CULT. All rights reserved
L’arricchimento dei dati
Questo arricchimento dalle fonti esterne ai cataloghi comporta anche, per esempio,
che un utente di lingua russa possa cercare la stringa
Толстой, Лев Николаевич
invece di
Tolstoj, Lev Nikolaevic
senza che nessuna biblioteca partecipante al progetto abbia mai creato un rinvio in
cirillico per questo nome.
16/26
Copyright 2008 @CULT. All rights reserved
L’arricchimento dei dati
17/26
Copyright 2008 @CULT. All rights reserved
Costruzione del cluster Titolo
La produzione dei cluster dei titoli per l’identificazione dell’Opera è stata piuttosto
complessa, per la mancanza di record di autorità per i titoli e per la carenza nei
record bibliografici, come detto, di punti di accesso autorizzati per questo tipo
di entità.
Il risultato ottenuto è di grande aiuto per gli utenti finali: decine di titoli diversi,
associati alle pubblicazioni presenti nei diversi cataloghi, sono raggruppati in un
unico punto di accesso autorizzato, per semplificare all’utente l’esperienza
della navigazione e l’identificazione della risorsa appropriata.
18/26
Copyright 2008 @CULT. All rights reserved
Raggruppamento sotto un unico titolo
di opera dei tantissimi titoli di
pubblicazioni presenti nel catalogo per
Promessi sposi.
Un solo titolo di opera
raggruppa più di
70 pubblicazioni diverse
catalogate dalle differenti biblioteche,
alle quali l’utente finale può arrivare
con una sola ricerca.
Il cluster Titolo
19/26
Copyright 2008 @CULT. All rights reserved
Risultato del click sul titolo Promessi sposi
Dall’Opera alle Istanze (pubblicazioni)
20/26
Copyright 2008 @CULT. All rights reserved
Architettura del portale
La realizzazione del portale di consultazione del progetto SHARE Catalogue è
caratterizzata da un’architettura a 3 differenti livelli:
Persone - Opere
Istanze (o pubblicazioni)
Item
21/26
Copyright 2008 @CULT. All rights reserved
Persone - Opere
L’insieme informativo sulla Persona, le sue Opere, l’ambito di studio e di
ricerca (nota biografica).
In questo livello informativo, arricchito dai dati provenienti da fonti esterne ai
cataloghi delle biblioteche con la finalità di estendere il potenziale di ricerca,
sono mostrati i soli titoli di opere per le quali nel catalogo unico compaia
almeno un titolo di una istanza o pubblicazione: questa selezione, che come
è noto è operata in un catalogo e non in una bibliografia, garantisce che
l’esperienza di ricerca degli utenti non sia frustrata dalla individuazione di
titoli di opere che non siano effettivamente presenti nelle collezioni delle
biblioteche.
22/26
Copyright 2008 @CULT. All rights reserved
Istanze (o pubblicazioni)
Il livello delle Istanze, associabili alle pubblicazioni, è realizzato utilizzando i dati
bibliografici dei differenti cataloghi delle biblioteche, collegati allo strato
soprastante, attraverso le relazioni con le Opere presenti.
Il livello delle Istanze/Pubblicazioni è realizzato attraverso indicizzazione nel motore
di ricerca SOLR, che consente di creare ulteriori raggruppamenti attraverso la
funzione delle faccette (raggruppamenti per data di pubblicazione, per lingue,
per autore, per editori, …), e che offre agli utenti finali una ricca serie di funzioni
di ricerca e navigazione.
23/26
Copyright 2008 @CULT. All rights reserved
Item
Ciascuna Istanza/Pubblicazione così individuata è collegata alle informazioni sui dati
e la disponibilità della copia, presenti negli OPAC locali di ciascuna biblioteca.
24/26
Copyright 2008 @CULT. All rights reserved
La navigazione semplificata
Esempio di navigazione a partire
dall’individuazione di un autore dalla
produzione letteraria piuttosto cospicua,
Francesco Guicciardini
e dalla selezione di una delle sue maggiori
opere storiografiche, la Storia d’Italia
indipendentemente dalle tante forme
catalografiche che le differenti pubblicazioni
dell’opera hanno assunto nei vari cataloghi.
25/26
Copyright 2008 @CULT. All rights reserved
La navigazione semplificata
Passaggio al Catalogo unico che raggruppa, in questo caso, i 18 record dell’opera Storia d’Italia di
Francesco Guicciardini presenti nelle differenti biblioteche.
Il percorso di navigazione verso questi risultati è stato guidato e molto semplificato rispetto ai cataloghi
nativi; l’esperienza di ricerca dovrebbe quindi essere positiva.
26/26
Copyright 2008 @CULT. All rights reserved
Conclusioni
Il progetto SHARE Catalogue è uno dei principali risultati di un progetto di
cooperazione e di condivisione di esperienze e risorse delle Università
campane, lucane e salentine.
È una iniziativa che punta a facilitare l’esperienza d’uso delle risorse in
biblioteche distribuite su un territorio geografico molto vasto: l’insieme dei
cataloghi, con la loro ricchezza e la loro specificità, è navigabile e fruibile
con pochi passaggi, secondo modelli di organizzazione dei dati (quali FRBR
e BIBFRAME) che nascono proprio dall’osservazione dei bisogni informativi
e di ricerca degli utenti.
In una modalità semplice e auspicabilmente intuitiva, si vuol consentire ai
ricercatori di orientarsi in un vasto universo informativo, per arrivare
facilmente a soddisfare le proprie esigenze.
27/26
Copyright 2008 @CULT. All rights reserved
Conclusioni
Il progetto punta anche a creare un gruppo di lavoro, formato da catalogatori
e altri esperti, disposti a condividere le proprie esperienze e competenze
per migliorare l’offerta informativa da proporre all’utenza.
La condivisione dei cataloghi, le analisi effettuate durante il processo di
elaborazione dei dati e nella successiva fase in cui il progetto è
gradualmente entrato in produzione, il confronto tra i propri metodi di
lavoro e quelli degli altri componenti il gruppo accrescono la
consapevolezza delle specificità della propria formazione e dell’apporto che
essa può dare per soddisfare le esigenze degli utenti e per adempiere alla
missione che le biblioteche devono avere.
28/26
Copyright 2008 @CULT. All rights reserved
Conclusioni
Attraverso SHARE Catalogue, il catalogo in linked open data, i sistemi di
ricerca e le diverse piattaforme editoriali realizzate nell’ambito del progetto
di cooperazione e di condivisione dei servizi SHARE, gli atenei
convenzionati promuovono la cultura dell’apertura dei saperi e della scienza
offrendo ai propri utenti e, in primo luogo, agli studiosi un insieme coerente
di strumenti per compiere, pubblicare e rendere liberamente accessibile in
rete, secondo standard internazionali, l’intero ciclo della ricerca: dalla
raccolta alla classificazione dei dati, dalla loro strutturazione relazionale alla
loro presentazione testuale, fino alla loro rielaborazione nell’ordine
discorsivo di un articolo o di un volume.
29/26
Copyright 2008 @CULT. All rights reserved
Demo: http://share-cat.oseegenius.it:1500/
Grazie
Roberto Delle Donne – Università Federico II
Tiziana Possemato – @CULT

Mais conteúdo relacionado

Mais procurados

Dm portali
Dm portaliDm portali
Dm portali
BiblioTu
 

Mais procurados (8)

Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...
Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...
Ricostruire le famiglie editoriali: FRBR per la storia delle case editrici at...
 
Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
 
VisualDDHub - final approach
VisualDDHub - final approachVisualDDHub - final approach
VisualDDHub - final approach
 
Open Data Lazio: cosa abbiamo fatto finora e come
Open Data Lazio: cosa abbiamo fatto finora e comeOpen Data Lazio: cosa abbiamo fatto finora e come
Open Data Lazio: cosa abbiamo fatto finora e come
 
ArCo Project - Meetup Ottobre 2018
ArCo Project - Meetup Ottobre 2018ArCo Project - Meetup Ottobre 2018
ArCo Project - Meetup Ottobre 2018
 
Modello concettuale, standard ed interoperabilità - METAFAD
Modello concettuale, standard ed interoperabilità - METAFAD Modello concettuale, standard ed interoperabilità - METAFAD
Modello concettuale, standard ed interoperabilità - METAFAD
 
Dm portali
Dm portaliDm portali
Dm portali
 
SHARE e l'editoria accademica Open Access
SHARE e l'editoria accademica Open AccessSHARE e l'editoria accademica Open Access
SHARE e l'editoria accademica Open Access
 

Semelhante a Stelline2016_Presentazione del Progetto SHARE Catalogue_pdf

SKOS, Nuovo Soggettario e Wikidata
SKOS, Nuovo Soggettario e Wikidata  SKOS, Nuovo Soggettario e Wikidata
SKOS, Nuovo Soggettario e Wikidata
KohaGruppoItaliano
 
2a. lezione ss archivi e biblioteche digitali
2a. lezione ss archivi e biblioteche digitali2a. lezione ss archivi e biblioteche digitali
2a. lezione ss archivi e biblioteche digitali
Mau-Messenger
 
2c. architettura open archive
2c. architettura open archive2c. architettura open archive
2c. architettura open archive
Mau-Messenger
 
E-LIS, archivio aperto per la biblioteconomia e la scienza dell'informazione
E-LIS, archivio aperto per la  biblioteconomia e la scienza dell'informazioneE-LIS, archivio aperto per la  biblioteconomia e la scienza dell'informazione
E-LIS, archivio aperto per la biblioteconomia e la scienza dell'informazione
Andrea Marchitelli
 
2d. lezione ss bd e standard
2d. lezione ss bd e standard2d. lezione ss bd e standard
2d. lezione ss bd e standard
Mau-Messenger
 
Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...
Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...
Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...
Giulio Bonanome
 
Bicocca Open Archive: funzionalità e servizi innovativi per la ricerca
Bicocca Open Archive: funzionalità e servizi innovativi per la ricercaBicocca Open Archive: funzionalità e servizi innovativi per la ricerca
Bicocca Open Archive: funzionalità e servizi innovativi per la ricerca
Bonaria Biancu
 

Semelhante a Stelline2016_Presentazione del Progetto SHARE Catalogue_pdf (20)

Wikibib : un nuovo ecosistema per i dati bibliografici
Wikibib : un nuovo ecosistema per i dati bibliograficiWikibib : un nuovo ecosistema per i dati bibliografici
Wikibib : un nuovo ecosistema per i dati bibliografici
 
La Biblioteca Digitale come metafora
La Biblioteca Digitale come metaforaLa Biblioteca Digitale come metafora
La Biblioteca Digitale come metafora
 
SKOS, Nuovo Soggettario e Wikidata
SKOS, Nuovo Soggettario e Wikidata  SKOS, Nuovo Soggettario e Wikidata
SKOS, Nuovo Soggettario e Wikidata
 
Il Web sta cambiando. E i nostri cataloghi?
Il Web sta cambiando. E i nostri cataloghi?Il Web sta cambiando. E i nostri cataloghi?
Il Web sta cambiando. E i nostri cataloghi?
 
[Eventokoha] abstract relatori
[Eventokoha] abstract relatori[Eventokoha] abstract relatori
[Eventokoha] abstract relatori
 
2a. lezione ss archivi e biblioteche digitali
2a. lezione ss archivi e biblioteche digitali2a. lezione ss archivi e biblioteche digitali
2a. lezione ss archivi e biblioteche digitali
 
Integrare le “memorie”. I Linked Open Data del Sistema Archivistico Nazionale...
Integrare le “memorie”. I Linked Open Data del Sistema Archivistico Nazionale...Integrare le “memorie”. I Linked Open Data del Sistema Archivistico Nazionale...
Integrare le “memorie”. I Linked Open Data del Sistema Archivistico Nazionale...
 
Bncf 2014 slide_lucarelli
Bncf 2014 slide_lucarelliBncf 2014 slide_lucarelli
Bncf 2014 slide_lucarelli
 
2c. architettura open archive
2c. architettura open archive2c. architettura open archive
2c. architettura open archive
 
La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008
La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008
La digitalizzazione dei fondi antichi / Maurizio Messina. - 2008
 
E-LIS, archivio aperto per la biblioteconomia e la scienza dell'informazione
E-LIS, archivio aperto per la  biblioteconomia e la scienza dell'informazioneE-LIS, archivio aperto per la  biblioteconomia e la scienza dell'informazione
E-LIS, archivio aperto per la biblioteconomia e la scienza dell'informazione
 
2d. lezione ss bd e standard
2d. lezione ss bd e standard2d. lezione ss bd e standard
2d. lezione ss bd e standard
 
Open Library Innovation - OliSuite
Open Library Innovation - OliSuiteOpen Library Innovation - OliSuite
Open Library Innovation - OliSuite
 
Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...
Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...
Un ILS open source per l'automazione delle biblioteche. L'ipotesi Koha a Ca' ...
 
Libraries 2.0 and RSS
Libraries 2.0 and RSSLibraries 2.0 and RSS
Libraries 2.0 and RSS
 
Linked Open Data per le Digital Humanities: l’esempio del Linked Open Data PO...
Linked Open Data per le Digital Humanities: l’esempio del Linked Open Data PO...Linked Open Data per le Digital Humanities: l’esempio del Linked Open Data PO...
Linked Open Data per le Digital Humanities: l’esempio del Linked Open Data PO...
 
Bicocca Open Archive: funzionalità e servizi innovativi per la ricerca
Bicocca Open Archive: funzionalità e servizi innovativi per la ricercaBicocca Open Archive: funzionalità e servizi innovativi per la ricerca
Bicocca Open Archive: funzionalità e servizi innovativi per la ricerca
 
Web2.0 e Library2.0
Web2.0 e Library2.0Web2.0 e Library2.0
Web2.0 e Library2.0
 
Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei d...
Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei d...Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei d...
Condividere l’authority control con Wikipedia e Wikidata. La nuova vita dei d...
 
10.Open Archive
10.Open Archive10.Open Archive
10.Open Archive
 

Mais de @CULT Srl

Odissea open data per la pa
Odissea   open data per la paOdissea   open data per la pa
Odissea open data per la pa
@CULT Srl
 
Adlug annual meeting 2013
Adlug annual meeting 2013Adlug annual meeting 2013
Adlug annual meeting 2013
@CULT Srl
 
Rdf and open linked data a first approach
Rdf and open linked data a first approach Rdf and open linked data a first approach
Rdf and open linked data a first approach
@CULT Srl
 
THGenius, rdf and open linked data for thesaurus management
THGenius, rdf and open linked data for thesaurus managementTHGenius, rdf and open linked data for thesaurus management
THGenius, rdf and open linked data for thesaurus management
@CULT Srl
 
OseeGenius - Semantic search engine and discovery platform
OseeGenius - Semantic search engine and discovery platformOseeGenius - Semantic search engine and discovery platform
OseeGenius - Semantic search engine and discovery platform
@CULT Srl
 
Enterprise Social Search
Enterprise Social SearchEnterprise Social Search
Enterprise Social Search
@CULT Srl
 
AquaBrowser in 5 minuti
AquaBrowser in 5 minutiAquaBrowser in 5 minuti
AquaBrowser in 5 minuti
@CULT Srl
 
ADLUG 2008 Web 2.0 - Library 2.0 presentation
ADLUG 2008 Web 2.0 - Library 2.0 presentationADLUG 2008 Web 2.0 - Library 2.0 presentation
ADLUG 2008 Web 2.0 - Library 2.0 presentation
@CULT Srl
 

Mais de @CULT Srl (18)

Share catalogue
Share catalogueShare catalogue
Share catalogue
 
35st adlug oli suite_new_ils
35st adlug oli suite_new_ils35st adlug oli suite_new_ils
35st adlug oli suite_new_ils
 
34th adlug ilike
34th adlug ilike34th adlug ilike
34th adlug ilike
 
34th adlug oli_suite_new_ils
34th adlug oli_suite_new_ils34th adlug oli_suite_new_ils
34th adlug oli_suite_new_ils
 
Automatic publication under LInked dAta paradigm of library DAta (ALIADA)
Automatic publication under LInked dAta paradigm of library DAta (ALIADA)Automatic publication under LInked dAta paradigm of library DAta (ALIADA)
Automatic publication under LInked dAta paradigm of library DAta (ALIADA)
 
Practical Linked Data: risorse, strumenti, utilizzi
Practical Linked Data: risorse, strumenti, utilizziPractical Linked Data: risorse, strumenti, utilizzi
Practical Linked Data: risorse, strumenti, utilizzi
 
Presentazione Progetto Europeo Aliada - LuBeC 2014
Presentazione Progetto Europeo Aliada - LuBeC 2014Presentazione Progetto Europeo Aliada - LuBeC 2014
Presentazione Progetto Europeo Aliada - LuBeC 2014
 
Adlug annual meeting 2014
Adlug annual meeting 2014Adlug annual meeting 2014
Adlug annual meeting 2014
 
Brochure: Linked Open Data PILLS
Brochure: Linked Open Data PILLSBrochure: Linked Open Data PILLS
Brochure: Linked Open Data PILLS
 
@Cult corporate identity
@Cult   corporate identity@Cult   corporate identity
@Cult corporate identity
 
Odissea open data per la pa
Odissea   open data per la paOdissea   open data per la pa
Odissea open data per la pa
 
Adlug annual meeting 2013
Adlug annual meeting 2013Adlug annual meeting 2013
Adlug annual meeting 2013
 
Rdf and open linked data a first approach
Rdf and open linked data a first approach Rdf and open linked data a first approach
Rdf and open linked data a first approach
 
THGenius, rdf and open linked data for thesaurus management
THGenius, rdf and open linked data for thesaurus managementTHGenius, rdf and open linked data for thesaurus management
THGenius, rdf and open linked data for thesaurus management
 
OseeGenius - Semantic search engine and discovery platform
OseeGenius - Semantic search engine and discovery platformOseeGenius - Semantic search engine and discovery platform
OseeGenius - Semantic search engine and discovery platform
 
Enterprise Social Search
Enterprise Social SearchEnterprise Social Search
Enterprise Social Search
 
AquaBrowser in 5 minuti
AquaBrowser in 5 minutiAquaBrowser in 5 minuti
AquaBrowser in 5 minuti
 
ADLUG 2008 Web 2.0 - Library 2.0 presentation
ADLUG 2008 Web 2.0 - Library 2.0 presentationADLUG 2008 Web 2.0 - Library 2.0 presentation
ADLUG 2008 Web 2.0 - Library 2.0 presentation
 

Stelline2016_Presentazione del Progetto SHARE Catalogue_pdf

  • 1. SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data Roberto delle Donne (Università degli Studi di Napoli Federico II) Tiziana Possemato (@Cult)
  • 2. Copyright 2008 @CULT. All rights reserved SHARE Scholarly Heritage and Access to Research Il catalogo presentato rientra in un vasto progetto di cooperazione e condivisione di servizi tra biblioteche campane, lucane e salentine denominato SHARE (Scholarly Heritage and Access to Research), che include, con diversi livelli di collaborazione: • adozione di un modello organizzativo improntato alla cooperazione; • accesso integrato all’informazione bibliografica e documentale relativa alle rispettive collezioni analogiche e digitali; • realizzazione di piattaforme comuni per l’editoria digitale: • SHARE Press • SHARE Journals • SHARE Books • SHARE Open Archive 2/26
  • 3. Copyright 2008 @CULT. All rights reserved Il progetto SHARE Catalogue Il progetto SHARE Catalogue propone il trattamento per la conversione in linked open data, la pubblicazione su differenti siti e portali open data, la costruzione di un portale unico per la fruizione dei dati dei Cataloghi bibliografici e di autorità delle Università partecipanti: • Università degli Studi di Napoli Federico II (Napoli) • Università degli Studi di Napoli L’Orientale (Napoli) • Università degli Studi Napoli Parthenope (Napoli) • Università degli Studi di Salerno (Salerno) • Università degli Studi del Sannio (Benevento) • Università degli Studi della Basilicata (Potenza) • Università degli Studi del Salento (Lecce) 3/26
  • 4. Copyright 2008 @CULT. All rights reserved Il progetto SHARE Catalogue – Scopo Scopo del progetto: integrare la notevole base di conoscenza rappresentata dai differenti Cataloghi di authority e bibliografici, per arricchirla con quella nuova e in divenire generata dal WEB e costruire un sistema informativo integrato per offrire agli utenti uno strumento unico di accesso ai vari OPAC delle Biblioteche. 4/26
  • 5. Copyright 2008 @CULT. All rights reserved SHARE Catalogue - Obiettivi Obiettivi del progetto: distinti in linee differenti ma complementari: • conversione dei dati secondo il modello di riferimento indicato dal W3C standard per i Linked Open Data, RDF – Resource Description Framework; • creazione di una struttura di dati basata su registrazioni distinte per le entità Persone e Opere, definite dal modello BIBFRAME; • arricchimento dei dati tramite il collegamento a progetti esterni, relativi soprattutto ad Authority file e enciclopedie online (es.: VIAF, Library of Congress Name Authority file, ISNI, Wikipedia, Wikidata, …). 5/26
  • 6. Copyright 2008 @CULT. All rights reserved SHARE Catalogue - Obiettivi • pubblicazione del dataset sui siti preposti ad accogliere dati in linked open data (CKAN, etc.), con licenza Creative Commons; • costruzione di un portale di consultazione, dotato di un’interfaccia di navigazione semplice ed intuitiva, basata sul nuovo modello di dati BIBFRAME – Bibliographic Framework Initiative. 6/26
  • 7. Copyright 2008 @CULT. All rights reserved BIBFRAME – Bibliographic Framework Initiative Il documento Bibliographic Framework as a Web of Data: Linked Data Model and Supporting Services, pubblicato dalla Library of Congress il 21 novembre 2012, espone un nuovo modello di dati pensato come evoluzione, in linked open data, del formato Marc 21. Le riflessioni sulle nuove norme catalografiche si focalizzano su alcuni punti specifici, tra cui: • maggior livello di identificazione e analisi del dato; • più attenzione ai vocabolari controllati; • maggior uso dei termini rispetto a codici; • enfasi sulle relazioni; • maggiore flessibilità nelle voci controllate. 7/26
  • 8. Copyright 2008 @CULT. All rights reserved BIBFRAME – Bibliographic Framework Initiative Il modello BIBFRAME è organizzato in 4 classi principali: • Opera - l’essenza concettuale del documento catalogato; - assimilabile all’opera e alla espressione del modello FRBR. • Istanza - una materializzazione individuale dell’opera. • Authority - un concetto chiave d’autorità che abbia una relazione con l’opera o con l’istanza (es. Persone, luoghi, Concetti, Organizzazioni). • Annotazioni - Elementi e risorse che decorano e/o arricchiscono le altre risorse del modello BIBFRAME con informazioni aggiuntive (es. holding, immagini di copertina, recensioni, …). 8/26
  • 9. Copyright 2008 @CULT. All rights reserved BIBFRAME – Bibliographic Framework Initiaitve La decisione di orientare un progetto di integrazione di dati provenienti da differenti cataloghi alle tecnologie del web semantico e dei linked open data è sostenuta da un’ampia letteratura che ne definisce il potenziale e la ricchezza. L’obiettivo dunque non è solo facilitare l’interazione, lo scambio e il riutilizzo delle informazioni tra sistemi informativi non omogenei (in termini di sw e di hw), ma soprattutto offrire benefici di sicuro interesse tanto per il gestore della base di conoscenza (i bibliotecari), quanto per gli utenti finali. 9/26
  • 10. Copyright 2008 @CULT. All rights reserved Descrizione generale dei cataloghi I dati catalografici considerati nel progetto derivano da tre LMS differenti (Aleph, Sebina e Millennium) e sono strutturati in Unimarc e Marc 21. Tipologie di dati considerate nel progetto: • la base dati bibliografica (record bibliografici); • la base dati di autorità (authority file). Nell’analisi dei dati originali particolare attenzione è stata posta agli elementi e alle pratiche catalografiche comuni nei differenti cataloghi, per individuarne punti di contatto tra le varie fonti ed elementi di diversità e di difformità. 10/26
  • 11. Copyright 2008 @CULT. All rights reserved Descrizione generale dei cataloghi Risultati dell’indagine conoscitiva: - un uso scarso o comunque non diffuso di attributi utili alla identificazione delle entità Opera e Espressione; - pochi record corredati da un punto di accesso autorizzato per il titolo (quello che le REICAT definiscono il “titolo uniforme”), o da elementi quali il titolo originale per identificare una Espressione. 11/26
  • 12. Copyright 2008 @CULT. All rights reserved Descrizione generale dei cataloghi Questa prima osservazione dei dati ha suggerito un altro percorso di analisi: - studio delle entità “Persona-Famiglia-Ente” con i relativi attributi: analisi degli elementi relativi al creatore o ai creatori di un’opera analizzati, principalmente, sui due authority file provenienti dall’Università Federico II e dall’Università della Basilicata. - comparazione di una medesima entità Persona* registrata sui differenti cataloghi, al fine di analizzare le pratiche catalografiche di ciascuna biblioteca e l’uniformità (o difformità) nella scelta dei punti di accesso. (* Si intende da ora in avanti per Persona un’entità del tipo Persona/Famiglia/Ente) 12/26
  • 13. Copyright 2008 @CULT. All rights reserved Arricchimento delle entità FRBR/BIBFRAME Obiettivo di una successiva fase di lavoro è stato quello di realizzare, attraverso l’utilizzo di API, web service e SPARQL endpoint messi a disposizione da fonti esterne al catalogo, un arricchimento dei dati attraverso la creazione di un “grappolo” (cluster) di forme utilizzate nei differenti cataloghi e provenienti dall’esterno, per ciascuna entità, e dunque: • cluster dei nomi – le forme, autorizzate e varianti, dei nomi delle Persone; • cluster dei titoli – punto di accesso autorizzato e forme varianti per i titoli delle Opere. 13/26
  • 14. Copyright 2008 @CULT. All rights reserved Costruzione del cluster Persona Arricchimento dei dati di origine tramite il VIAF: per ogni entità Persona sono recuperate dal VIAF tutte le forme attraverso le quali può essere rappresentato il dato ricercato. L’arricchimento del dato originario avviene in differenti step: • estrazione, dagli authority file delle biblioteche, della forma autorizzata e delle forme varianti del nome; • estrazione, dai record catalografici, dei campi in cui è registrato l’elemento creatore/creatori; • confronto diretto dei punti di accesso così ottenuti con le forme presenti sul VIAF, strutturate a grappolo; • creazione del grappolo finale con tutte le forme del nome relazionate e associate ad un unico identificatore locale. 14/26
  • 15. Copyright 2008 @CULT. All rights reserved Il cluster Persona Risultato di un grappolo o cluster Persona per l’entità Richard von Mises, con le differenti forme del nome provenienti da: • Authority file • VIAF • Rinvii (da record di authority) • Forme utilizzate nei record bibliografici 15/26
  • 16. Copyright 2008 @CULT. All rights reserved L’arricchimento dei dati Questo arricchimento dalle fonti esterne ai cataloghi comporta anche, per esempio, che un utente di lingua russa possa cercare la stringa Толстой, Лев Николаевич invece di Tolstoj, Lev Nikolaevic senza che nessuna biblioteca partecipante al progetto abbia mai creato un rinvio in cirillico per questo nome. 16/26
  • 17. Copyright 2008 @CULT. All rights reserved L’arricchimento dei dati 17/26
  • 18. Copyright 2008 @CULT. All rights reserved Costruzione del cluster Titolo La produzione dei cluster dei titoli per l’identificazione dell’Opera è stata piuttosto complessa, per la mancanza di record di autorità per i titoli e per la carenza nei record bibliografici, come detto, di punti di accesso autorizzati per questo tipo di entità. Il risultato ottenuto è di grande aiuto per gli utenti finali: decine di titoli diversi, associati alle pubblicazioni presenti nei diversi cataloghi, sono raggruppati in un unico punto di accesso autorizzato, per semplificare all’utente l’esperienza della navigazione e l’identificazione della risorsa appropriata. 18/26
  • 19. Copyright 2008 @CULT. All rights reserved Raggruppamento sotto un unico titolo di opera dei tantissimi titoli di pubblicazioni presenti nel catalogo per Promessi sposi. Un solo titolo di opera raggruppa più di 70 pubblicazioni diverse catalogate dalle differenti biblioteche, alle quali l’utente finale può arrivare con una sola ricerca. Il cluster Titolo 19/26
  • 20. Copyright 2008 @CULT. All rights reserved Risultato del click sul titolo Promessi sposi Dall’Opera alle Istanze (pubblicazioni) 20/26
  • 21. Copyright 2008 @CULT. All rights reserved Architettura del portale La realizzazione del portale di consultazione del progetto SHARE Catalogue è caratterizzata da un’architettura a 3 differenti livelli: Persone - Opere Istanze (o pubblicazioni) Item 21/26
  • 22. Copyright 2008 @CULT. All rights reserved Persone - Opere L’insieme informativo sulla Persona, le sue Opere, l’ambito di studio e di ricerca (nota biografica). In questo livello informativo, arricchito dai dati provenienti da fonti esterne ai cataloghi delle biblioteche con la finalità di estendere il potenziale di ricerca, sono mostrati i soli titoli di opere per le quali nel catalogo unico compaia almeno un titolo di una istanza o pubblicazione: questa selezione, che come è noto è operata in un catalogo e non in una bibliografia, garantisce che l’esperienza di ricerca degli utenti non sia frustrata dalla individuazione di titoli di opere che non siano effettivamente presenti nelle collezioni delle biblioteche. 22/26
  • 23. Copyright 2008 @CULT. All rights reserved Istanze (o pubblicazioni) Il livello delle Istanze, associabili alle pubblicazioni, è realizzato utilizzando i dati bibliografici dei differenti cataloghi delle biblioteche, collegati allo strato soprastante, attraverso le relazioni con le Opere presenti. Il livello delle Istanze/Pubblicazioni è realizzato attraverso indicizzazione nel motore di ricerca SOLR, che consente di creare ulteriori raggruppamenti attraverso la funzione delle faccette (raggruppamenti per data di pubblicazione, per lingue, per autore, per editori, …), e che offre agli utenti finali una ricca serie di funzioni di ricerca e navigazione. 23/26
  • 24. Copyright 2008 @CULT. All rights reserved Item Ciascuna Istanza/Pubblicazione così individuata è collegata alle informazioni sui dati e la disponibilità della copia, presenti negli OPAC locali di ciascuna biblioteca. 24/26
  • 25. Copyright 2008 @CULT. All rights reserved La navigazione semplificata Esempio di navigazione a partire dall’individuazione di un autore dalla produzione letteraria piuttosto cospicua, Francesco Guicciardini e dalla selezione di una delle sue maggiori opere storiografiche, la Storia d’Italia indipendentemente dalle tante forme catalografiche che le differenti pubblicazioni dell’opera hanno assunto nei vari cataloghi. 25/26
  • 26. Copyright 2008 @CULT. All rights reserved La navigazione semplificata Passaggio al Catalogo unico che raggruppa, in questo caso, i 18 record dell’opera Storia d’Italia di Francesco Guicciardini presenti nelle differenti biblioteche. Il percorso di navigazione verso questi risultati è stato guidato e molto semplificato rispetto ai cataloghi nativi; l’esperienza di ricerca dovrebbe quindi essere positiva. 26/26
  • 27. Copyright 2008 @CULT. All rights reserved Conclusioni Il progetto SHARE Catalogue è uno dei principali risultati di un progetto di cooperazione e di condivisione di esperienze e risorse delle Università campane, lucane e salentine. È una iniziativa che punta a facilitare l’esperienza d’uso delle risorse in biblioteche distribuite su un territorio geografico molto vasto: l’insieme dei cataloghi, con la loro ricchezza e la loro specificità, è navigabile e fruibile con pochi passaggi, secondo modelli di organizzazione dei dati (quali FRBR e BIBFRAME) che nascono proprio dall’osservazione dei bisogni informativi e di ricerca degli utenti. In una modalità semplice e auspicabilmente intuitiva, si vuol consentire ai ricercatori di orientarsi in un vasto universo informativo, per arrivare facilmente a soddisfare le proprie esigenze. 27/26
  • 28. Copyright 2008 @CULT. All rights reserved Conclusioni Il progetto punta anche a creare un gruppo di lavoro, formato da catalogatori e altri esperti, disposti a condividere le proprie esperienze e competenze per migliorare l’offerta informativa da proporre all’utenza. La condivisione dei cataloghi, le analisi effettuate durante il processo di elaborazione dei dati e nella successiva fase in cui il progetto è gradualmente entrato in produzione, il confronto tra i propri metodi di lavoro e quelli degli altri componenti il gruppo accrescono la consapevolezza delle specificità della propria formazione e dell’apporto che essa può dare per soddisfare le esigenze degli utenti e per adempiere alla missione che le biblioteche devono avere. 28/26
  • 29. Copyright 2008 @CULT. All rights reserved Conclusioni Attraverso SHARE Catalogue, il catalogo in linked open data, i sistemi di ricerca e le diverse piattaforme editoriali realizzate nell’ambito del progetto di cooperazione e di condivisione dei servizi SHARE, gli atenei convenzionati promuovono la cultura dell’apertura dei saperi e della scienza offrendo ai propri utenti e, in primo luogo, agli studiosi un insieme coerente di strumenti per compiere, pubblicare e rendere liberamente accessibile in rete, secondo standard internazionali, l’intero ciclo della ricerca: dalla raccolta alla classificazione dei dati, dalla loro strutturazione relazionale alla loro presentazione testuale, fino alla loro rielaborazione nell’ordine discorsivo di un articolo o di un volume. 29/26
  • 30. Copyright 2008 @CULT. All rights reserved Demo: http://share-cat.oseegenius.it:1500/ Grazie Roberto Delle Donne – Università Federico II Tiziana Possemato – @CULT