SlideShare uma empresa Scribd logo
1 de 45
Perspektivwechsel
Normdaten:
ein neues Nutzungskonzept
an der UB und HMT Leipzig
103. Bibliothekartag, Bremen, 5.6.2014
Martin Czygan, Universitätsbibliothek Leipzig
Anke Hofmann, Bibliothek der Hochschule für Musik
und Theater „Felix Mendelssohn Bartholdy“ Leipzig
Normdatenimplementierung
als finc Milestone
Normdaten = Potentiale
Großer Bestandteil klassischer Katalogisierungsarbeit
Normdaten = Potentiale
Enorme Datensammlungen
http://d-nb.info/gnd/118576291
Normdaten = Potentiale
GND als übergreifendes Normierungssystem
https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GND+neu
Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte
http://de.wikipedia.org/wiki/Gustav_Mahler
Normdaten = Potentiale
Steigerung des
Suchkomforts für unsere
Nutzer/innen!
Bisherige Anwendungsfelder
„klassische“ Datenauswertung: Verweissysteme
•Personennamen und Körperschaften
•Schlagworte
•(musikalische) Werktitel
Weitere Datenauswertung
•Länderbezug für Autor/innen und Komponist/innen
•Geofacette
Personennamen und
Körperschaften
Anreicherung des Titelsatzes mit den Verweisungsformen der verknüpften
Personen
https://katalog.hmt-leipzig.de/Record/0003347345 fincMARC 900
Schlagworte
Anreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der
verknüpften Schlagworte
https://katalog.hmt-leipzig.de/Record/0000525350 fincMARC 950
(musikalische) Werktitel
Anreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel,
Tonart, Werkverzeichnisnummer (Besetzung)
fincMARC 920https://katalog.hmt-leipzig.de/Record/0008964807
EST: Konzerte, Vc Orch, G 479
Violoncellokonzert, Nr. 2
Cellokonzert, D-Dur
EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36
Streichquartette, op. 20
(musikalische) Werktitel
Anreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel,
Tonart, Werkverzeichnisnummer (Besetzung)
Länderbezug
Auswertung der DIN-Ländercodes am
Personen-Normsätzen --> Facettenbildung
„Haben Sie Noten von Komponisten
Rumänischer Herkunft?“
“Geofacette“ der TU Freiberg
Umsetzung einer Idee von Wiesenmüller, Maylein, Pfeffer:
http://www.ub.uni-heidelberg.de/archiv/12555
Auswertung und Indexierung der geografischen Codes an
Schlagwort-Normsätzen
Grenzen?!
• Bislang nur für lokale Bibliotheksdaten (SWB) –
externe Quellen im Discovery System werden
bislang nicht berücksichtigt
• Relativ simples Verwendungsmuster:
Synonymverweisungen
• Keine visuelle Umsetzung der Inhalte eines
Normsatzes
• GND als einziger Datenpool
Vier Beispiele
• Perspektivwechsel Normdaten: ein neues
Nutzungskonzept an der UB und HMT.
• 05.06.2014 1000
Überblick
• Intro – 1
• Namensvarianten via GND – 7
• Alternative Sucheinstiege – 1
• Knowledge Graph – 2
• Querschnittssuche – 5
• Ausblick – 3
Intro
• Ein rotes Band – die GND
• Ein anderes – Nutzung von Indizes als (NoSQL)
Datenbanken
GND-Anreicherung
externer Quellen
Datensatz der externen Quelle
„Naxos Music Library“
http://d-nb.info/gnd/118638157
Namensvarianten 1
• GND basierte Erweiterung von MARC-Records
um Namensvarianten
• gnd.es:variantNameForThePerson
• Angewendet auf: Naxos Music Library, Gallica,
RISM, IMSLP
Namensvarianten 2
• Nutzung eines Normdatenindex für
Kandidatensuche
• Nutzung einer minimalen HTTP–API für
Taxonomieabfragen
Namensvarianten 3
• Suche aller MARC 100.a Einträge der externen
Quelle im Normdatenindex
• Für alle Kandidaten–GNDs, überprüfe, ob Beruf
unter den Oberbegriff Musikerin (4040841-3)
oder Musiker (4170818-0) fällt
• Für alle Kandidaten–GNDs, überprüfe, ob
Lebensdaten in den Normdaten hinterlegt sind
Namensvarianten 4
• Naxos - 71815
• RISM - 11241
• IMSLP - 51722
• Gallica - 23754
Namensvarianten 5
• 54339 Name insgesamt
• 5051 Namen in Naxos und GND
• 719 Namen konnten zugeordnet werden
Namensvarianten 6
• Naxos – 719 Namen mit hoher
Wahrscheinlichkeit korrekt
• RISM – 415
• IMSLP – variabel
• Gallica – 268
• generelle Frage der Qualitätsprüfung
Namensvarianten 7
• Alternative Implementierung – zum Beispiel
über eine Abfrage der Normdaten vor der
eigentlichen Suche
Sucheinstiege 1
• API um die GND–Daten
• narrower terms, broader terms, [synonyms]
• siehe Namesvarianten (gehört Musikerin zu
den Oberbegriffen?)
• Anzeige von ähnlichen Begriffen in der Art von
Facetten – mit Größenabschätzung (und
anderen Metriken)
Optimierte Datennutzung
für Suchanfragen
optimierte Nutzung der Taxonomie der Schlagwörter
Darstellung der semantischer Beziehungen von GND-
Einträgen untereinander
http://melvil.d-nb.de/swd-search?term=oboenrohr
Knowledge Graph 1
• Inspiration – Google Knowledge Graph
• Indexierung von GND, VIAF und DBPedia
• technische Herausforderungen
(Dokumentenanzahl, Konvertierung,
Kompression)
Knowledge Graph 2
• Beispiel Goethe
• Lebensdaten, Wirkungsort, Einflüsse, Werke, ...
• {“birthDate”: “…”, “deathDate”: “…”,
“placeOfBirth”: “…”, “placeOfDeath”: “image”,
…}
Querschnittssuchen 1
• Menschen gruppieren Dinge auch außerhalb
von Facetten
• Wikipedia–Kategorien
Weitere Datenpools und
Services:
„Wikipedia-Querschnittssuche“
http://de.wikipedia.org/wiki/Kategorie:Komponist_(Romantik)
Querschnittssuche 2
• Zutaten: GND–Index, Wikipedia–Normdaten–
Index, Wikipedia–Category–Index
Querschnittssuche 3
• {"p": "dnb.es:placeOfBusiness", "s":
"gnd:63067-6", "o": "gnd:4005728-8"}
• {"ndl": "00575178", "gnd": "4191405-3",
"lccn": "sh/85/004443", "title": "Americium",
"typ": "s"}
• {"category": "Carbonylkomplex", "pages":
["Chromhexacarbonyl", "Metallcarbonyle",
“...”]}
Querschnittssuche 4
• {"p": "dnb.es:placeOfBusiness", "s":
"gnd:63067-6", "o": "gnd:4005728-8"}
• {"ndl": "00575178", "gnd": "4191405-3",
"lccn": "sh/85/004443", "title": "Americium",
"typ": "s"}
• {"category": "Carbonylkomplex", "pages":
["Chromhexacarbonyl", "Metallcarbonyle",
“...”]}
Querschnittssuche 5
• Beispiel – Kategorie:Romantik_(Musik)
• 1225 Seiten unter der Kategorie
• 1082 GNDs
• Mit diesen GNDs kann man eine Suchabfrage
auf einen Katalog absetzen
Ausblick 1
• verwendete Daten – GND, VIAF, DBPedia
• noch nicht einbezogen: Freebase,
Authoritydaten anderer Nationalbibliotheken,
datahub.io, ISNI, ...
• Ansätze sind nicht unbedingt allgemein
anwendbar (z.B. Berufsbezeichnung)
Ausblick 2
• Index – Elasticsearch*
• Workflowmanagement – luigi*, gluish*
• Konverter – gomarckit*, nttoldj*, wptoldj*
• SQL für TSV: textql*
• Unix – awk*, cat*, cut*, grep*, sed*
Ausblick 3
• * Open source
• Linked Data schafft neue Verbindungen
Normdaten = Potentiale!
Voraussetzungen und
Perspektiven
• Übernahme der VIAF-IDs in die Datensätze der GND
• Bereitstellung von IDs in Initiativen zur
Datenfreigabe
• Konsistentere Nutzung der GND in Bibliotheken
• Projekte zur rückwirkenden Anreicherung in
Bibliotheken
• Nachnutzung der GND / VIAF auch in
nichtbibliothekarischen Projekten
Übernahme der VIAF-IDs in
die Datensätze der GND
http://viaf.org/viaf/99258155
Bereitstellung von IDs in
Initiativen zur Datenfreigabe
https://opac.rism.info/search?id=653004096&db=251&View=rism
https://opac.rism.info/id/rismid/653004096?format=marc
Konsistentere Nutzung der
GND in Bibliotheken
Sacherschließungsquote im Buchbestand der HMT: 42,4%
Nachnutzung der GND in
nicht-bibliothekarischen
Projekten
http://pdr.bbaw.de/projekt
http://in2n.de/
Danke für Ihre Aufmerksamkeit!
http://blog.finc.info
Martin Czygan
martin.czygan@uni-leipzig.de
Anke Hofmann
anke.hofmann@hmt-leipzig.de

Mais conteúdo relacionado

Mais procurados

MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...Becker Hans-Georg
 
Bibliotheksdatenpublikation und linked data
Bibliotheksdatenpublikation und linked dataBibliotheksdatenpublikation und linked data
Bibliotheksdatenpublikation und linked dataLars G. Svensson
 
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Stefan Dietze
 
Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...
Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...
Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...Heinz Pampel
 
VuFind - Ein Open Source Projekt
VuFind - Ein Open Source ProjektVuFind - Ein Open Source Projekt
VuFind - Ein Open Source ProjektTill Kinstler
 

Mais procurados (11)

MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
 
Informationsbeschaffung in Bibliotheken
Informationsbeschaffung in BibliothekenInformationsbeschaffung in Bibliotheken
Informationsbeschaffung in Bibliotheken
 
Linked Open Data an der HSH
Linked Open Data an der HSHLinked Open Data an der HSH
Linked Open Data an der HSH
 
Bibliotheksdatenpublikation und linked data
Bibliotheksdatenpublikation und linked dataBibliotheksdatenpublikation und linked data
Bibliotheksdatenpublikation und linked data
 
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
Human-in-the-Loop: das Web als Grundlage interdisziplinärer Data Science Meth...
 
Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...
Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...
Vom Projekt zum Service – zur Rolle von re3data.org in der Forschungsdateninf...
 
Forschungsdaten und DSpace
Forschungsdaten und DSpaceForschungsdaten und DSpace
Forschungsdaten und DSpace
 
Bam Vortrag Fh Lb
Bam Vortrag Fh LbBam Vortrag Fh Lb
Bam Vortrag Fh Lb
 
Bam Clio
Bam ClioBam Clio
Bam Clio
 
VuFind - Ein Open Source Projekt
VuFind - Ein Open Source ProjektVuFind - Ein Open Source Projekt
VuFind - Ein Open Source Projekt
 
Von A wie Artikel recherchieren bis U wie Upload im Repository: Umsetzung von...
Von A wie Artikel recherchieren bis U wie Upload im Repository: Umsetzung von...Von A wie Artikel recherchieren bis U wie Upload im Repository: Umsetzung von...
Von A wie Artikel recherchieren bis U wie Upload im Repository: Umsetzung von...
 

Destaque

CAPITULO II
CAPITULO IICAPITULO II
CAPITULO II26200926
 
ManageEngine ServiceDesk Plus Admin Guide
ManageEngine ServiceDesk Plus Admin GuideManageEngine ServiceDesk Plus Admin Guide
ManageEngine ServiceDesk Plus Admin GuideServiceDesk Plus
 
Angular js 24 april 2013 amsterdamjs
Angular js   24 april 2013 amsterdamjsAngular js   24 april 2013 amsterdamjs
Angular js 24 april 2013 amsterdamjsMarcin Wosinek
 
Growth Hacking with LinkedIn - By Peter Chee @thinkspace
Growth Hacking with LinkedIn - By Peter Chee @thinkspaceGrowth Hacking with LinkedIn - By Peter Chee @thinkspace
Growth Hacking with LinkedIn - By Peter Chee @thinkspacePeter Chee
 
Migraña y discapacidad.
Migraña y discapacidad.Migraña y discapacidad.
Migraña y discapacidad.José María
 
Nilla Recommendation Letter
Nilla Recommendation LetterNilla Recommendation Letter
Nilla Recommendation LetterRobert Kodingo
 
Apresentação OMG! (Interdesigners 2011)
Apresentação OMG! (Interdesigners 2011)Apresentação OMG! (Interdesigners 2011)
Apresentação OMG! (Interdesigners 2011)Caio Henrique
 
Cancer de ovario mi parte
Cancer de ovario mi parteCancer de ovario mi parte
Cancer de ovario mi parteMancho Suarez
 
Presentación Increventia
Presentación IncreventiaPresentación Increventia
Presentación IncreventiaCIT Marbella
 
El naixement del món modern reforma
El naixement del món modern reformaEl naixement del món modern reforma
El naixement del món modern reformaRaquel Pérez Badia
 
Input (warm up)
Input (warm up)Input (warm up)
Input (warm up)ashtic
 
Online Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.org
Online Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.orgOnline Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.org
Online Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.orgSteven Clift
 
Thomas Alva Edison
Thomas Alva EdisonThomas Alva Edison
Thomas Alva Edisonjclua1234
 
Brochure on Training , Courses & other HR Services
Brochure on Training , Courses & other HR Services Brochure on Training , Courses & other HR Services
Brochure on Training , Courses & other HR Services Nizufer Ansari
 

Destaque (20)

EdicióN13
EdicióN13EdicióN13
EdicióN13
 
CAPITULO II
CAPITULO IICAPITULO II
CAPITULO II
 
ManageEngine ServiceDesk Plus Admin Guide
ManageEngine ServiceDesk Plus Admin GuideManageEngine ServiceDesk Plus Admin Guide
ManageEngine ServiceDesk Plus Admin Guide
 
El procesador
El procesadorEl procesador
El procesador
 
Aparato psiquico
Aparato psiquicoAparato psiquico
Aparato psiquico
 
Angular js 24 april 2013 amsterdamjs
Angular js   24 april 2013 amsterdamjsAngular js   24 april 2013 amsterdamjs
Angular js 24 april 2013 amsterdamjs
 
Growth Hacking with LinkedIn - By Peter Chee @thinkspace
Growth Hacking with LinkedIn - By Peter Chee @thinkspaceGrowth Hacking with LinkedIn - By Peter Chee @thinkspace
Growth Hacking with LinkedIn - By Peter Chee @thinkspace
 
Migraña y discapacidad.
Migraña y discapacidad.Migraña y discapacidad.
Migraña y discapacidad.
 
Nilla Recommendation Letter
Nilla Recommendation LetterNilla Recommendation Letter
Nilla Recommendation Letter
 
Apresentação OMG! (Interdesigners 2011)
Apresentação OMG! (Interdesigners 2011)Apresentação OMG! (Interdesigners 2011)
Apresentação OMG! (Interdesigners 2011)
 
Workshop Webtools
Workshop WebtoolsWorkshop Webtools
Workshop Webtools
 
Cancer de ovario mi parte
Cancer de ovario mi parteCancer de ovario mi parte
Cancer de ovario mi parte
 
Presentación Increventia
Presentación IncreventiaPresentación Increventia
Presentación Increventia
 
El naixement del món modern reforma
El naixement del món modern reformaEl naixement del món modern reforma
El naixement del món modern reforma
 
Content Scope España 2015
Content Scope España 2015 Content Scope España 2015
Content Scope España 2015
 
Input (warm up)
Input (warm up)Input (warm up)
Input (warm up)
 
House101
House101House101
House101
 
Online Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.org
Online Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.orgOnline Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.org
Online Communities at EuroPCom - Steven Clift KHub.Net and E-Democracy.org
 
Thomas Alva Edison
Thomas Alva EdisonThomas Alva Edison
Thomas Alva Edison
 
Brochure on Training , Courses & other HR Services
Brochure on Training , Courses & other HR Services Brochure on Training , Courses & other HR Services
Brochure on Training , Courses & other HR Services
 

Semelhante a Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen
Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über PersonenVon IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen
Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über PersonenGeorg Vogeler
 
Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...
Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...
Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...Patrick Danowski
 
Text and Data Mining
Text and Data MiningText and Data Mining
Text and Data Miningcneudecker
 
Linked-RDA-Data in der Praxis
Linked-RDA-Data in der PraxisLinked-RDA-Data in der Praxis
Linked-RDA-Data in der PraxisAlexander Haffner
 
Die GND und ihr Weg in das Semantic Web
Die GND und ihr Weg in das Semantic WebDie GND und ihr Weg in das Semantic Web
Die GND und ihr Weg in das Semantic WebAlexander Haffner
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebAlexander Haffner
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Felix Lohmeier
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltAdrian Pohl
 
Ausblick - PIDs für Informationsobjekte im Kontext von Open Science
Ausblick - PIDs für Informationsobjekte im Kontext von Open ScienceAusblick - PIDs für Informationsobjekte im Kontext von Open Science
Ausblick - PIDs für Informationsobjekte im Kontext von Open ScienceHeinz Pampel
 
Workshop "Performing Arts Database based on Wikidata"
Workshop "Performing Arts Database based on Wikidata"Workshop "Performing Arts Database based on Wikidata"
Workshop "Performing Arts Database based on Wikidata"Beat Estermann
 
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Georg Rehm
 
Linked Open (Library) Data
Linked Open (Library) DataLinked Open (Library) Data
Linked Open (Library) DataFab Fuerste
 

Semelhante a Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig (16)

Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen
Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über PersonenVon IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen
Von IIIF zu IPIF? Ein Vorschlag für den Datenaustausch über Personen
 
Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...
Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...
Das Potenzial von freiem Wissen- Kooperationsmöglichkeiten von Wikipedia & Co...
 
Von Hagel 2004
Von Hagel 2004Von Hagel 2004
Von Hagel 2004
 
Von Hagel 2004
Von Hagel 2004Von Hagel 2004
Von Hagel 2004
 
Text and Data Mining
Text and Data MiningText and Data Mining
Text and Data Mining
 
Linked-RDA-Data in der Praxis
Linked-RDA-Data in der PraxisLinked-RDA-Data in der Praxis
Linked-RDA-Data in der Praxis
 
Die GND und ihr Weg in das Semantic Web
Die GND und ihr Weg in das Semantic WebDie GND und ihr Weg in das Semantic Web
Die GND und ihr Weg in das Semantic Web
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im Web
 
Forschungsdaten fachspezifisch archivieren und bereitstellen
Forschungsdaten fachspezifisch archivieren und bereitstellenForschungsdaten fachspezifisch archivieren und bereitstellen
Forschungsdaten fachspezifisch archivieren und bereitstellen
 
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
 
Linked Open Data in der Bibliothekswelt
Linked Open Data in der BibliotheksweltLinked Open Data in der Bibliothekswelt
Linked Open Data in der Bibliothekswelt
 
Ausblick - PIDs für Informationsobjekte im Kontext von Open Science
Ausblick - PIDs für Informationsobjekte im Kontext von Open ScienceAusblick - PIDs für Informationsobjekte im Kontext von Open Science
Ausblick - PIDs für Informationsobjekte im Kontext von Open Science
 
Workshop "Performing Arts Database based on Wikidata"
Workshop "Performing Arts Database based on Wikidata"Workshop "Performing Arts Database based on Wikidata"
Workshop "Performing Arts Database based on Wikidata"
 
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
Nah am Nutzer (Steinberg) - Konzept und Umsetzung eines Discovery-Services mi...
 
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
 
Linked Open (Library) Data
Linked Open (Library) DataLinked Open (Library) Data
Linked Open (Library) Data
 

Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig

  • 1. Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT Leipzig 103. Bibliothekartag, Bremen, 5.6.2014 Martin Czygan, Universitätsbibliothek Leipzig Anke Hofmann, Bibliothek der Hochschule für Musik und Theater „Felix Mendelssohn Bartholdy“ Leipzig
  • 3. Normdaten = Potentiale Großer Bestandteil klassischer Katalogisierungsarbeit
  • 4. Normdaten = Potentiale Enorme Datensammlungen http://d-nb.info/gnd/118576291
  • 5. Normdaten = Potentiale GND als übergreifendes Normierungssystem https://wiki.dnb.de/display/ILTIS/Informationsseite+zur+GND+neu
  • 6. Normdaten = PotentialeInteressant auch für nicht-bibliothekarische Projekte http://de.wikipedia.org/wiki/Gustav_Mahler
  • 7. Normdaten = Potentiale Steigerung des Suchkomforts für unsere Nutzer/innen!
  • 8. Bisherige Anwendungsfelder „klassische“ Datenauswertung: Verweissysteme •Personennamen und Körperschaften •Schlagworte •(musikalische) Werktitel Weitere Datenauswertung •Länderbezug für Autor/innen und Komponist/innen •Geofacette
  • 9. Personennamen und Körperschaften Anreicherung des Titelsatzes mit den Verweisungsformen der verknüpften Personen https://katalog.hmt-leipzig.de/Record/0003347345 fincMARC 900
  • 10. Schlagworte Anreicherung des Titelsatzes mit Synonymverweisungen und Oberbegriffen der verknüpften Schlagworte https://katalog.hmt-leipzig.de/Record/0000525350 fincMARC 950
  • 11. (musikalische) Werktitel Anreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung) fincMARC 920https://katalog.hmt-leipzig.de/Record/0008964807
  • 12. EST: Konzerte, Vc Orch, G 479 Violoncellokonzert, Nr. 2 Cellokonzert, D-Dur EST: Quartette, Vl 1 2 Va Vc, H 3, 31-36 Streichquartette, op. 20 (musikalische) Werktitel Anreicherung des Titelsatzes mit Informationen aus Werktitel: alternative Titel, Tonart, Werkverzeichnisnummer (Besetzung)
  • 13. Länderbezug Auswertung der DIN-Ländercodes am Personen-Normsätzen --> Facettenbildung „Haben Sie Noten von Komponisten Rumänischer Herkunft?“ “Geofacette“ der TU Freiberg Umsetzung einer Idee von Wiesenmüller, Maylein, Pfeffer: http://www.ub.uni-heidelberg.de/archiv/12555 Auswertung und Indexierung der geografischen Codes an Schlagwort-Normsätzen
  • 14. Grenzen?! • Bislang nur für lokale Bibliotheksdaten (SWB) – externe Quellen im Discovery System werden bislang nicht berücksichtigt • Relativ simples Verwendungsmuster: Synonymverweisungen • Keine visuelle Umsetzung der Inhalte eines Normsatzes • GND als einziger Datenpool
  • 15. Vier Beispiele • Perspektivwechsel Normdaten: ein neues Nutzungskonzept an der UB und HMT. • 05.06.2014 1000
  • 16. Überblick • Intro – 1 • Namensvarianten via GND – 7 • Alternative Sucheinstiege – 1 • Knowledge Graph – 2 • Querschnittssuche – 5 • Ausblick – 3
  • 17. Intro • Ein rotes Band – die GND • Ein anderes – Nutzung von Indizes als (NoSQL) Datenbanken
  • 18. GND-Anreicherung externer Quellen Datensatz der externen Quelle „Naxos Music Library“ http://d-nb.info/gnd/118638157
  • 19. Namensvarianten 1 • GND basierte Erweiterung von MARC-Records um Namensvarianten • gnd.es:variantNameForThePerson • Angewendet auf: Naxos Music Library, Gallica, RISM, IMSLP
  • 20. Namensvarianten 2 • Nutzung eines Normdatenindex für Kandidatensuche • Nutzung einer minimalen HTTP–API für Taxonomieabfragen
  • 21. Namensvarianten 3 • Suche aller MARC 100.a Einträge der externen Quelle im Normdatenindex • Für alle Kandidaten–GNDs, überprüfe, ob Beruf unter den Oberbegriff Musikerin (4040841-3) oder Musiker (4170818-0) fällt • Für alle Kandidaten–GNDs, überprüfe, ob Lebensdaten in den Normdaten hinterlegt sind
  • 22. Namensvarianten 4 • Naxos - 71815 • RISM - 11241 • IMSLP - 51722 • Gallica - 23754
  • 23. Namensvarianten 5 • 54339 Name insgesamt • 5051 Namen in Naxos und GND • 719 Namen konnten zugeordnet werden
  • 24. Namensvarianten 6 • Naxos – 719 Namen mit hoher Wahrscheinlichkeit korrekt • RISM – 415 • IMSLP – variabel • Gallica – 268 • generelle Frage der Qualitätsprüfung
  • 25. Namensvarianten 7 • Alternative Implementierung – zum Beispiel über eine Abfrage der Normdaten vor der eigentlichen Suche
  • 26. Sucheinstiege 1 • API um die GND–Daten • narrower terms, broader terms, [synonyms] • siehe Namesvarianten (gehört Musikerin zu den Oberbegriffen?) • Anzeige von ähnlichen Begriffen in der Art von Facetten – mit Größenabschätzung (und anderen Metriken)
  • 27. Optimierte Datennutzung für Suchanfragen optimierte Nutzung der Taxonomie der Schlagwörter Darstellung der semantischer Beziehungen von GND- Einträgen untereinander http://melvil.d-nb.de/swd-search?term=oboenrohr
  • 28. Knowledge Graph 1 • Inspiration – Google Knowledge Graph • Indexierung von GND, VIAF und DBPedia • technische Herausforderungen (Dokumentenanzahl, Konvertierung, Kompression)
  • 29. Knowledge Graph 2 • Beispiel Goethe • Lebensdaten, Wirkungsort, Einflüsse, Werke, ... • {“birthDate”: “…”, “deathDate”: “…”, “placeOfBirth”: “…”, “placeOfDeath”: “image”, …}
  • 30. Querschnittssuchen 1 • Menschen gruppieren Dinge auch außerhalb von Facetten • Wikipedia–Kategorien
  • 32.
  • 33. Querschnittssuche 2 • Zutaten: GND–Index, Wikipedia–Normdaten– Index, Wikipedia–Category–Index
  • 34. Querschnittssuche 3 • {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"} • {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"} • {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}
  • 35. Querschnittssuche 4 • {"p": "dnb.es:placeOfBusiness", "s": "gnd:63067-6", "o": "gnd:4005728-8"} • {"ndl": "00575178", "gnd": "4191405-3", "lccn": "sh/85/004443", "title": "Americium", "typ": "s"} • {"category": "Carbonylkomplex", "pages": ["Chromhexacarbonyl", "Metallcarbonyle", “...”]}
  • 36. Querschnittssuche 5 • Beispiel – Kategorie:Romantik_(Musik) • 1225 Seiten unter der Kategorie • 1082 GNDs • Mit diesen GNDs kann man eine Suchabfrage auf einen Katalog absetzen
  • 37. Ausblick 1 • verwendete Daten – GND, VIAF, DBPedia • noch nicht einbezogen: Freebase, Authoritydaten anderer Nationalbibliotheken, datahub.io, ISNI, ... • Ansätze sind nicht unbedingt allgemein anwendbar (z.B. Berufsbezeichnung)
  • 38. Ausblick 2 • Index – Elasticsearch* • Workflowmanagement – luigi*, gluish* • Konverter – gomarckit*, nttoldj*, wptoldj* • SQL für TSV: textql* • Unix – awk*, cat*, cut*, grep*, sed*
  • 39. Ausblick 3 • * Open source • Linked Data schafft neue Verbindungen
  • 40. Normdaten = Potentiale! Voraussetzungen und Perspektiven • Übernahme der VIAF-IDs in die Datensätze der GND • Bereitstellung von IDs in Initiativen zur Datenfreigabe • Konsistentere Nutzung der GND in Bibliotheken • Projekte zur rückwirkenden Anreicherung in Bibliotheken • Nachnutzung der GND / VIAF auch in nichtbibliothekarischen Projekten
  • 41. Übernahme der VIAF-IDs in die Datensätze der GND http://viaf.org/viaf/99258155
  • 42. Bereitstellung von IDs in Initiativen zur Datenfreigabe https://opac.rism.info/search?id=653004096&db=251&View=rism https://opac.rism.info/id/rismid/653004096?format=marc
  • 43. Konsistentere Nutzung der GND in Bibliotheken Sacherschließungsquote im Buchbestand der HMT: 42,4%
  • 44. Nachnutzung der GND in nicht-bibliothekarischen Projekten http://pdr.bbaw.de/projekt http://in2n.de/
  • 45. Danke für Ihre Aufmerksamkeit! http://blog.finc.info Martin Czygan martin.czygan@uni-leipzig.de Anke Hofmann anke.hofmann@hmt-leipzig.de