1. Was sind Metadaten? Welche Typen gibt es? Wo sind sie zu finden? Welche Aufgaben haben sie?
2. Bestandteile und den Aufbau von Metadatenstandards. Beispiele für Metadatenstandards Ausflug zu XML.
3. Unterschied zwischen Metadaten-Standards und Metadaten-Schemas. Application Profiles
4. Mappings und Crosswalk. Typische Mappingprobleme
5. Austausch von Metadaten: Schnittstellen.
6. Metadaten im Semantic Web
7. Metadaten-Management in der ZBW
8. Thesen zur Zukunft der Bibliothek und welche Rolle das Berufsfeld Metadaten-Management dort spielen kann
Erweiterter Foliensatz einer Fortbildung für Studierenden / BibliothekarInnen an der UB Graz, April 2013
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft
1. Die ZBW ist Mitglied der Leibniz-Gemeinschaft
Auf Du und Du mit Dublin Core & Co. –
Berufsfeld Metadaten-Management im Kontext der Bibliothek
der Zukunft
Kirsten Jeude
12.04.2013
Metadaten-Management im Leibniz-Informationszentrum Wirtschaft
„metadata“ Shira Golding, https://secure.flickr.com/photos/boojee/3743753784/in/photostream
2. Seite 2
Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-
Management im Kontext der Bibliothek der Zukunft
1. Was sind Metadaten?
2. Metadatenstandards (inkl. Exkurs XML)
3. Application Profiles und Interoperabilität
4. Mapping
5. Schnittstellen
6. Metadaten im Semantic Web
7. Metadaten-Management in der ZBW
8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der
Zukunft
Gliederung
4. Was sind Metadaten?
Definitionen über Definitionen
• „… are (structured) data about data.“
Miller, Eric: An introduction to the resource description framework. In: D-Lib Magazine, (May) 1998; Foulonneau, Muriel; Riley Jenn
(2008): Metadata for Digital Resources; u.v.m.
• „Unter Metadaten ("Daten über Daten") versteht man strukturierte Daten, mit deren Hilfe eine
Informationsressource beschrieben und dadurch besser auffindbar gemacht wird.“
SUB Göttingen Metadata Server
• „… structured, encoded data that describe characteristics of information-bearing entities to
aid in their identification, discovery, assessment, and management of the described entities“
American Library Association´s Committee on Cataloguing
• „… is any type of formal description of a resource, regardless of format“
Mitchell, Nicole: Metadata Basics (The Southeastern Librarian, Fall 2006)
• „…is cataloging done by men“
Delsey, Tom, National Library of Canada
• „… is machine understandable information about web resources or other things.“
Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997.
• „An item of metadata is a relationship that someone claims to exist between two entities.“
Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources
• „I like to think of metadata as data which removes from a user (human or machine) the need
to have full advance knowledge of the existence or characteristics of things of potential
interest in the environment“
Lorcan Dempsey, zit. in: Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources
Seite 4
5. Metadata “is machine understandable information about
web resources or other things.“ (Tim Berners-Lee)
Web-Ressourcen:
Seite 5
6. Andere Dinge:
Bücher und Zeitschriften etc.:
Museums-Objekte:
Bilder:
Tonträger:
Personen:
Metadata “is machine understandable information about
web resources or other things.“(Tim Berners-Lee)
Seite 6
7. Karteikarte im Zettelkatalog
Metadaten – getrennt vom Objekt Metadaten – im Objekt enthalten
CIP (Cataloging in
Publication)
Datensatz in bibliographischer Datenbank
Header einer HTML-
Seite mit Metadaten
Metadata „is any type of formal description of a resource,
regardless of format“ (Nicole Mitchell)
Metadaten in
Form von COinS
(Mikroformat) in
HTML-Seite
Seite 7
8. Metadata „are (structured) data about data“ (Eric Miller)
Metadaten sind „Daten über Daten“
Daten - Buch „Daten über Daten“
Metadata / Marcia Lei Zeng and Jian Qin
Zeng, Marcia Lei *1956-*
Qin, Jian *1956-*
London : Facet, 2008
xvii, 365 p. : ill. ; 23cm
Includes bibliographical references and index
1-85604-655-9, 978-1-85604-655-8 (pbk)
Metadaten
STRUKTURIERTE
Metadaten-Schema
Titel
Verfasser
Sonstige beteil. Person
Erschienen:
Umfang
Anmerkung
ISBN
Schlagwörter
Seite 8
10. PPN:
Titel:
Verfasser:
Sonst. Personen:
Erschienen:
Umfang:
Anmerkung:
ISBN:
Schlagwörter:
Mehr zum Thema:
Zeng, Marcia LeiVerfasser:
Metadaten-Element
Metadatensatz
folgt Regeln (z.B. Nachname Komma Leerzeichen Vorname)
Element-Wert
571230652
Metadata / Marcia Lei Zeng and Jian Qin
Zeng, Marcia Lei *1956-*
Qin, Jian *1956-*
London : Facet, c2008
xvii, 365 p. : ill. ; 23cm
Includes bibliographical references and index
1-85604-655-9, 978-1-85604-655-8 (pbk) : £39.95
*Metadaten / *Metadata
Dewey-Dezimalklassifikation: 025.3
Metadata „are (structured) data about data“
Seite 10
11. Metadata is „[…] to aid in their identification, discovery,
assessment, and management of the described entities“
AUFGABEN von Metadaten (FRBR User Tasks)
1. Verlässliches FINDEN ermöglichen: Recherche nach vom Benutzer
festgelegten Kriterien.
2. IDENTIFIZIEREN: Unterscheiden, was verschieden ist, z.B. Unterscheidung
von zwei Texten oder Aufnahmen, die mit demselben Titel veröffentlicht
wurden.
3. AUSWÄHLEN: Zusammenführen, was zusammengehört, den
Benutzerbedürfnissen entsprechend : z.B. Auswahl eines Texts in einer
Sprache, die der Benutzer versteht
4. Zu Gewähltem ZUGANG ERHALTEN: z.B. Bestellung für eine Publikation
abgeben
FRBR: Functional Requirements for Bibliographic Records
Seite 11
12. Metadata is „[…] to aid in their identification, discovery,
assessment, and management of the described entities“
TYPEN von Metadaten
Deskriptive Metadaten : Beschreiben eine Ressource zum Zweck der Entdeckung,
der Identifikation, der Auswahl und des Zugangs
Strukturelle Metadaten: Beschreiben die interne Organisation einer Ressource.
Beschreiben, wie miteinander verbundene Objekte miteinander in Beziehung
stehen, z.B. wie Seiten geordnet werden müssen, damit ein Kapitel entsteht.
Administrative Metadaten: „meta-metadata“; Informationen, die helfen eine
Ressource zu verwalten:
Technische Metadaten: Enthalten Informationen über Format und Dateityp
Metadaten für das Rechtemanagement: Enthalten Informationen, die für die
Berechtigung des Zugriffs und Informationen über das geistige Eigentum dienen
Herkunfts-Metadaten (Provenienz-Metadaten): Metadaten über die Herkunft der
Ressource: Feststellung der Vertrauenswürdigkeit; Bewahrung der Nutzbarkeit
Seite 12
13. • Formale Beschreibung einer Ressource
• Strukturierte „Daten über Daten“
• Ein Metadatensatz besteht aus Metadaten-Elementen und den dazugehörigen
Werten
• Für eine Vielzahl an Dingen (Texte, Bilder, Objekte, Personen, etc.)
• Getrennt vom beschriebenen Objekt oder enthalten im Objekt
• menschen-lesbar, maschinen-lesbar (und maschinen-interpretierbar)
• Aufgaben von Metadaten sind die Unterstützung beim Finden, Identifizieren,
Auswählen einer Ressource, sowie Zugang zu ihr erhalten
• Es gibt verschiedene Typen von Metadaten: deskriptive, administrative,
technische Metadaten, Struktur- und Provenienz-Metadaten, Metadaten für das
Rechtemanagement
Seite 13
Zusammenfassung: Was sind Metadaten?
15. Metadatenstandards
Standards?
"The nice thing about standards is that you have so many to
choose from. Furthermore, if you do not like any of them, you
can just wait for next year's model."
Quelle: Andrew Tanenbaum, Computer Networks, 2nd edn., p. 254
Ein Metadatenstandard
• sorgt für: Konsistenz der Metadaten
• verbessert: Metadatennutzung
• erlaubt: Austausch von Metadaten und die Verlinkung von
Objekten anwendungsübergreifend
Seite 15
16. Metadatenstandards
„A content metadata standard is defined as an open specification that itemizes a set
of elements and their meanings. Each element is tagged with an identifier (e.g.,
"Title", "Author") that distinguishes the element from other elements within the
standard. In addition, each element has a set of constraints or rules specifying the
allowable content of the element and its relationship to other elements within the
standard.“ (http://www.niso.org/publications/white_papers/crosswalk/ )
"A metadata schema provides a formal structure designed to identify the knowledge
structure of a given discipline and to link that structure to the information of the
discipline through the creation of an information system that will assist the
identification, discovery, and use of information within that discipline" . American
Library Association Committee on Cataloging: Description and Access (CC:DA) Task Force on
Metadata
Seite 16
17. Aufbau eines Metadaten-Standards am
Beispiel Dublin Core
Dublin Core Metadata Initiative (DCMI)
Zunächst für die Beschreibung von
Webressourcen
15 Kern-Elemente (“Core”): Title, Creator,
Subject, Description, Publisher,
Contributor, Date, Type, Format, Identifier,
Source, Language, Relation, Coverage,
and Rights
Alle optional und wiederholbar
Reihenfolge der Elemente beliebig
http://dublincore.org/documents/dces/
Title ”Metadata Demystified”
Creator ”Brand, Amy”
Creator ”Daly, Frank”
Creator ”Meyers, Barbara”
Subject ”metadata”
Description ”Presents an overview of
metadata conventions in publishing.”
Publisher ”NISO Press”
Publisher ”The Sheridan Press”
Date ”2003-07"
Type ”Text”
Format ”application/pdf”
Identifier ”http://www.niso.org/standards
/resources/Metadata_Demystified.pdf”
Language ”en”
Seite 17
18. Dublin Core Metadata Element Set
Dublin Core Simple: 15 Elemente:
titel Titel
creator Verfasser oder Urheber
contributor Mitarbeiter
publisher Verlag
subject Thema des Inhalts (Sacherschließung)
date Datum
coverage Abdeckung
description Beschreibung
language Sprache
type Art, Gattung
format Format
identifier Eindeutige Identifizierung
relation Beziehung
source Quelle
rights Rechte
Seite 18
19. Dublin Core - Metadatenelemente
Element (property): Merkmal / Eigenschaft einer Ressource, wie Titel,
Autor etc.
„An Element is a property of a resource. As intended here, "properties" are
attributes of resources – characteristics that a resource may "have", such
as a Title, Publisher, or Subject.“ (DCMI Glossary)
Seite 19
20. Dublin Core Element Set - Übung
DC element value
title
creator
contributor
publisher
subject
date
coverage
DC element value
description
language
type
format
identifier
relation
rights
Sprache: rumänisch, englisch
Seite 20
21. Dublin Core Element Set - Übung: Lösung
Sprache: rumänisch, englisch
DC element value
title Intelectuali Români implicati în
dezvoltarea civilizatiei economice
title Romanian intellectuals inolved in
the development of the economic
civilization
creator Saizu, Ioan
contributor -----
publisher Ed. Acad. Romane
subject Wirtschaftsgeschichte
subject Rumänien
date 2003
coverage Rumänien
DC element value
description --------------
language rumänisch
language englisch
type Buch / Book
format 308 S.
identifier 973-270983-9
relation ---------------
rights ---------------
Seite 21
22. Dublin Core Metadata Terms
15 Elemente bieten wenig Differenzierung. Was tun?
Dublin Core Metadata Terms
Element Refinement: Verfeinerung der Bedeutung eines Elements
Die Refinements können als Unterbegriff des Elements verstanden werden.
Beispiel: Element „Description“ mit den Refinements „Abstract“ oder „Table of
Contents“
55 Terms: http://dublincore.org/documents/dcmi-terms/
dc.description
Kann jegliche Art von Beschreibung enthalten
dcterms.abstract
Hier sind nur Abstracts zulässig
dcterms.tableOfContents
Hier sind nur Inhaltsverzeichnisse zulässig
Seite 22
23. Encoding Schemes
Weitere semantische und syntaktische Differenzierung bieten Encoding Schemes
Wie, in welcher Form wird das Element beschrieben?
Kodierungs-Schema, kontextabhängige Informationen oder Parsing-Regeln (Syntax-
Analyse-Regeln), die dazu beitragen, den Wert eines Elements zu interpretieren.
Semantics is about meaning; syntax is about form
Weibel, S. et.al. (2002)
Semantik: Semantik (von Altgriechisch σημαίνειν sēmaínein ‚bezeichnen‘, ‚zum Zeichen gehörig‘),
auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen.
Zeichen können in diesem Fall Wörter, Phrasen oder Symbole sein. Die Semantik beschäftigt sich
typischerweise mit den Beziehungen zwischen Zeichen und Bedeutungen dieser Zeichen.
[http://de.wikipedia.org/wiki/Semantik]
Syntax: die rein formalen Beziehungen zwischen (sprachlichen) Zeichen, z.B.
Datumsangabe: soll in der Syntax YYYY-MM-DD erfolgen.
Seite 23
24. Vocabulary Encoding Schemes
Vocabulary Encoding Scheme (VES):
Beschreibt, dass der Wert eine Bezeichnung aus einem kontrollierten
Wortschatz ist, z.B. Wert = Klasse (Notation) aus der DDC, Deskriptor aus
dem Standard Thesaurus Wirtschaft (STW), etc.
Bsp. Element „subject“ mit dem Encoding Scheme „DDC“
<dcterms:subject xsi:type „dcterms:DDC“>330</dcterms:subject>
Achtung! Jetzt
kommt ein Thema,
und zudem stammt
der Wert aus der
DDC
Seite 24
25. Vocabulary Encoding Schemes:
Klassifikationen – Thesauri – Schlagwörter und mehr
Klassifikationen
DDC Dewey Decimal Classification
UDC Universelle Dezimalklassifikation
BK Basisklassifikation
LCC Library of Congress Classification
RVK Regensburger Verbundklassifikation
JEL: Klassifikation des Journal of Economic Literature
Thesauri
STW Standard Thesaurus Wirtschaft
TGN Getty Thesaurus of Geographic Names
TheSoz Theaurus Sozialwissenschaften
IBLK Europäischer Thesaurus Internationale
Beziehungen und Länderkunde
MeSH Medical Subject Headings
AGROVOC Agrarwissenschaften, Forstwirtschaft,
Fischerei, Nahrungsmittel und verwandter Gebiete
INFODATA Thesaurus Informationswissenschaft
Normdateien (authority files)
GND Gemeinsame Normdatei (Personen,
Körperschaften , Schlagwörter)
LCSH Library of Congress Subject
Headings
Rameau Normdatei der BnF
VIAF Virtual International Authority File
Sonstiges kontrolliertes Vokabular
IMT Internet Media Type (auch MIME-
Type ) klassifiziert den Dateityp
z.B. für DC-Element „format“
DCMIType Vocabulary
Ressourcentype
z.B. für DC-Element „type“
Seite 25
26. Syntax Encoding Schemes
Syntax Encoding Scheme (SES):
Gibt an, wie die Zeichenketten, die bei der Beschreibung eines Objekts
verwendet werden, aufgebaut sein müssen und regelt damit die syntaktische
Struktur der Beschreibung, z.B. „JJJJ-MM-TT" als Standardausdruck eines
Datums.
Bsp. Element „Date“ mit Encoding Scheme „JJJJ-MM-TT“
<dcterms:date xsi:type dcterms:W3CDTF>2007-12-04</dcterms:date>
Achtung! Jetzt
kommt ein Datum
und außerdem hat
es das Format JJJJ-
MM-TT
Seite 26
27. Syntax Encoding Schemes
Normen und weitere Standards
ISO 8601 Data elements and interchange formats - Information interchange -
Representation of dates and times
W3C-DTF „defines a profile of ISO 8601, the International Standard for the
representation of dates and times „
DCMI Period Encoding Scheme (Zeiträume): „for identifying a single time interval using its limits „
DCMI BOX Encoding Scheme (geographische Räume): „method for identifying a region of space
using its geographic limits and representing that information as a value string.“
DCMI Point Encoding Scheme (geographischer Punkt): „a mechanism for indicating a point in
space using its geographic coordinates and representing that information as a
value string. „
URIs (Uniform Resource Identifier)
URL Uniform Resource Locator
URN Uniform Resource Name
Handle Handle
DOI Digital Objekt Identifier
PURL Persistent Uniform Resource Locator
Weitere Identifier
ISBN International Standard Book Number:
ISBN 978-3-7657-2781-8
ISSN International Standard Serial Number:
ISSN 4177-0815
BICI Book Item and Component Identifier
SICI Serial Item and Contribution Identifier
(ANSI/NISO standard Z39.56).
ISMN International Standard Music Number Seite 27
28. Syntax and Vocabulary Encoding Schemes
RFC 3066: Vorläufer der ISO-639
ISO 639 Sprachen (Sprachcodes):
ISO 639-1 (Alpha-2 Code)
ISO 639-2 (Alpha-3 Code)
ISO 639-3 (Alpha-3 Code for comprehensive coverage of
languages)
Semantisch im Hinblick auf das enthaltene Vokabular.
Syntaktisch im Hinblick auf die Kodierung in bestimmter Anzahl Zeichen
automatisch prüfbar (Plausibilitätsprüfung).
http://upload.wikimedia.org/wikipe
dia/commons/thumb/9/95/ISO_63
9_Schematische_Darstellung.svg
/700px-
ISO_639_Schematische_Darstell
ung.svg.png
Seite 28
29. Metadaten-Standards und -Schemas definieren zulässige Elemente und ihre
Bedeutung (Semantik), sowie ihre Form (Syntax):
• Sachliche Definition des Inhalts (content rules). Diese besagen, wie die Werte
für das Datenelement ausgewählt und repräsentiert werden.
• Regeln über die Form des Feldinhalts (representation rules): z.B. Regeln
über die Groß- und Kleinschreibung
• Regeln über die Syntax des Inhalts, also wie der Inhalt codiert werden muss:
z.B. ein Datum muss immer in der Form YYYY-MM-TT eingegeben werden
(syntax encoding scheme)
• Regeln über die zulässig Inhalte (content values), z.B. der Inhalt des Feldes
muss aus einem kontrollierten Vokabular, wie z.B. dem STW, der DDC, der
UDC, der BK, etc. stammen (vocabulary encoding scheme)
• Angaben zur Wiederholbarkeit und Verpflichtung eines Elements
• Angaben wie verschiedene Elemente miteinander in Beziehung stehen
Zusammenfassung: Aufbau eines Metadatenstandards
Seite 29
30. Zusammenfassung: Aufbau von Dublin Core
• Dublin Core Metadata Element Set = 15 Elemente (Dublin Core Simple)
• Dublin Core Metadata Terms (Dublin Core Qualified)
• Element Refinements = 55 Elemente
• Encodings Schemes und Refinements sind „Qualifier“
• Dublin Core Qualifier: http://dublincore.org/documents/usageguide/qualifiers.shtml
• Dublin Core auf Deutsch: KIM - Kompetenzzentrum Interoperable Metadaten
Seite 30
31. Prinzipien von Dublin Core
One-to-One-Principle - Das 1:1-Prinzip:
Jede Beschreibung (decription) steht für ein und nur ein Objekt (Ressource), z.B.
eine Beschreibung für einen gedruckten Text, eine weitere für die elektronische
Ausgabe.
Dumb-Down-Principle – Prinzip der Vereinfachung:
Die Bedeutung eines Elements kann verfeinert, aber nicht erweitert werden.
Beispiel: Element „description“ mit den refinements „ToC“ oder „Abstract“ (dumb
down der Eigenschaft und des Wertes)
Appropriate Values – Angemessene / entsprechende Inhalte:
„Best Practice“ : menschen- und maschinelesbar.
Seite 31
32. Prinzipien von Dublin Core
1. Simplicity: Einfachheit der Beschreibung
2. Semantic interoperability: Semantische Interoperabilität
3. International consensus: Internationale Übereinkunft über Standard
4. Interdisziplinary: Interdisziplinär einsetzbar
5. Extensibility: Erweiterbarkeit, keine Beschränkung auf DC-Elemente
6. Modularity: Modular, im Baukasten-Prinzip verwendbar
7. Modifiability: Jedes Element kann durch die Angabe eines Attributs verändert werden
8. Optionality: keine Pflichtfelder
9. Repeatability: Alle Elemente können mehrmals in einem Datensatz auftreten
10. Independency: Unabhängigkeit von einer spezifischen Syntax
Seite 32
33. Metadatenformate
bibliographisch / deskriptiv
Metadatenstandard ist nicht gleich Metadatenformat
Dublin Core Metadatenstandard
• als .txt-Datei
• als .html- oder .xhtml-Datei
• als .xml-Datei
• als .rdf-Statements
Syntax Guidelines für die korrekte Konstruktion von DC-Datensätzen in diese
Formate: http://dublincore.org/specifications/
Grundsätzlich:
• Metadatenstandards als Text-Standard entwickelt
und nachträglich weitere Repräsentationen
• Originäre XML-Standards
• Proprietäre Formate, z.B. .mrc für MARC
Metadatenformat, z.B. DC-DS-XML
Seite 33
34. Exkurs XML
Extensible Markup Language = erweiterbare Auszeichnungs-
Sprache
Beispiele für Auszeichnungssprachen: HTML (Hypertext Markup
Language), SGML (Standard Generalized Markup Language),
XML
Standard zur Erstellung von maschinen- und
menschenlesbaren Dokumenten
Der Standard wurde vom World Wide Web Consortium (W3C)
definiert
Befehle in Form von semantischen tags:
<titel> </titel>, <date> </date>, <creator></creator>
<befehl>Information</befehl>
Seite 34
35. Unterschiede zwischen HTML und XML
Unterschied zu HTML
Tags sind nicht festgelegt. Sie werden für
spezielle Anwendung definiert:
Datenbank 1: <autor>Marx, Karl<autor/>
Datenbank 2: <verfasser>Marx, Karl<verfasser/>
HTML „Kann man sehen“ = Auszeichnung der
Strukturierung von Inhalten
XML transportiert Semantik = logische
Auszeichnung der Inhalte
Gemeinsamkeiten
Auszeichnungssprachen
Stammen von SGML ab
Befehle in Form von tags
Textformat (im Sinne von
Nicht-binär)
<h1>Metadaten für Einsteiger</h1>
Jetzt kommt
eine
Überschrift:
20 pt., fett
Ende
Überschrift:
Absatz-
schriftart
HTML
<titel>Metadaten für Einsteiger</titel>
Hier kommt
der Titel der
Ressource
Hier endet
der Titel der
Ressource
XML
Präsentation
Bedeutung
Seite 35
36. XML - Eigenschaften
• Trennt strikt zwischen Daten und Verarbeitung der Daten: Welche Software für
die Verarbeitung verwendet wird, ist nicht festgelegt.
• XML = Textformat: erleichtert es Menschen die enthaltene Information zu verstehen
und macht unabhängig von bestimmten technischen Implementierungen
• Für hoch-strukturierte Daten (aus relationalen Datenbanken) und semi-
strukturierte Daten (von Menschen verfasste Texte)
• Einfach: leichter zu erlernen und leichter zu implementieren als Vorfahren (SGML)
.csv vs. .xml
Seite 36
37. XML - Eigenschaften
• Flexibel: da „tags“ (Bezeichner) in XML nicht festgelegt sind, kann jeder Betreiber
sein eigenes Format entsprechende seiner Bedürfnisse erstellen.
• Flexible vs. Interoperabel: DB1: <verfasser>, DB2: <autor>, aber identische
Semantik
• Metadatenformate ausgedrückt in XML:
100 1 $aSchultz, Theodore Paul,$0(DE-
601)060006277.
245 10 $aChanging world prices, women's
wages, and the fertility transition
:$bSweden, 1860 - 1910 /$cT. Paul
Schultz.
MARC21
MARC21 in XML
Seite 37
38. Metadatenstandards in XML
Metadata Object and Description Schema
• Originärer XML-Standard
• Entwickelt als Kompromiss zwischen dem komplexen MARC21 und dem
einfachen Dublin Core
• Für elektronische Ressourcen
• Entwickelt vom Network Development and MARC Standards Office der LoC
• Bildet Teile der MARC21-Elemente ab, bei Standard-Konvertierung
Informationsverlust
Seite 38
39. Machine-Readable Cataloging - MARC21
Internationales Austausch- und
Speicherformat
• für bibliographische Nachweise
in Bibliothekskatalogen
• Entwickelt von der LoC
• ANSI/NISO Z39.2
• Viele Dialekte
1000 Elemente mit Unterfeldern
und Indikatoren
• ca. 60 am häufigsten
verwendete
• Fixed Fields (00X)
Kat.-Regelwerk: AARC2
Format: .mrc / .marc
Tools: Marc-Editor „MarcEdit“
xxxxxnaa a22yyyyy c 4500
001 592906469
003 DE-601
005 20090728100724.0
008 090304s2008 000 0 eng d
016 7 $a7153508$2DE-600
040 $aGBVCP$bger$erakwb
041 0 $aeng
100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE-
588)133059545
245 10$aEscaping the unemployment trap :$bthe case of
East Germany /$cChristian Merkl; Dennis J. Snower
300 $bgraph. Darst.
650 7$81.1x$aLangzeitarbeitslosigkeit$0(DE-
601)091374367$0(DE-STW)18124-6$2stw
650 7$81.2x$aArbeitsproduktivität$0(DE-
601)091347742$0(DE-STW)10440-1$2stw
[…]
700 1 $aSnower, Dennis J.$eAuthor$4aut$0(DE-
601)366752960$0(DE-588)124825109
773 08$iIn: $tJournal of comparative
economics$dAmsterdam : Elsevier$gVol. 36, No. 4 (2008),
p. 542-556$q36:4<542-556$w(DE-601)130445541$x0147-5967
773 08$iIn:
900 $aGBV$bZBW Kiel <206>
952 $d36$j2008$e4$c12$h542-556
954 $a26$b923675930$c01$x0206
http://www.loc.gov/marc/
Seite 39
40. 650 = Sachschlagwort
Indikator 1 = undefiniert
Indikator 2 = Quelle des Vokabular wird spezifiziert in Unterfeld 2
Unterfeld a = Deskriptor
Unterfeld 0 = Identifier der Ressource in der Datenbank „DE-601“ (GBV)
Unterfeld 2 = Deskriptor stammt aus dem STW
Unterfelder und Indikatoren
Seite 40
41. Project of Integrated Catalogue Automation - PICA
PICA+: Datenbank-Format
PICA3: Katalogisierungssicht
u.a. GBV, SWD, HEBIS, DNB
für bibliographische Nachweise in
Bibliothekskatalogen
ca. 1300 Informationseinheiten:
Elemente mit Unterfeldern
Verschiedene Satztypen, die
miteinander verknüpft sind
(Hierarchische Datensätze)
Kat.-Regelwerk: RAK (D)
001@ $026$aU
001A $00206:04-03-09
001B $00206:10-03-09$t10:42:23.000
001D $00206:04-03-09
001U $0utf8
001X $00
002@ $0Asu
003@ $0592906469
010@ $aeng
011@ $a2008
021A $aEscaping the unemployment trap$dthe case of
East Germany$hChristian Merkl; Dennis J. Snower
027D/00 $aJournal of comparative
economics$pAmsterdam$nElsevier$00147-5967$z7153508
028A $dChristian$aMerkl$9533312205$8Christian@Merkl ;
PND-ID: 133059545
028B/01 $dDennis J.$aSnower$9366752960$8Dennis
J.@Snower ; PND-ID: 124825109
031A $d36$j2008$e4$c12$h542-556
034M $agraph. Darst.
039B $cIn$9130445541$8Journal of comparative
economics. - Amsterdam : Elsevier$x200800000360004458
039B $cIn$7!562253327!
045D/00 $9091374367$8Langzeitarbeitslosigkeit
045D/00 $9091347742$8Arbeitsproduktivität
045D/00 $9091384966$8Qualifikation
045D/49 $b49
101B $004-03-09$t09:15:56.000
Seite 41
43. 43
Pica3 - Pica+
Steuerzeichen
in Pica3 sind
Unterfelder (subfields)
in Pica+
Subfield
Eine individuelle Informationseinheit in
einer strukturierten Datei.
Eine Untergliederung eines Feldes.
Beispiel: ein Feld für Titelangaben hat
mehrere Unterfelder: HST, Zusatz,
Verfasserangabe
Seite 43
44. Beispiele für Metadatenstandards
Metadatenstandards
1.für bibliographische Ressourcen: z.B. Pica+, MODS, DC
2.für den Datentausch: z.B. MAB 2, MARC21, ONIX
3.für Multimedia-Objekte: z.B. MIX (Bilder), MPEG-7/21 (Video)
4.für digitale Sammlungen: z.B. METS (Wrapper)
5.für sozialwiss. Forschungsdaten: z.B. DDI, SDMX
6.für Archive (Findbücher): z.B. EAD
7.für die Langzeitarchivierung: z.B. PREMIS
8.für die Strukturauszeichnung von Dokumenten: z.B. TEI
9.für Museumsobjekte: z.B. LIDO
Seite 44
45. Seeing Standards: A Visualization of the Metadata
Universe (Jenn Riley)
http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards.pdf Seite 45
46. DOKUMENTATION eines Metadaten-Standards
• „Uses and Features“
• „Usage Guidelines“
• „Implementation Guidelines“
• „Schemas and Outline“
• „Data Dictionary“
• “Specification”
• Encoding Guidelines
• Code Lists
• Beispiel-Datensätze
• Tutorials
• Mailinglisten und Foren
• Einsatzgebiet und –möglichkeiten
• Anwendungsregelwerk
• Aufzählung und genaue Definition
der Elemente
• Kodierungs-Regeln
• Kodierungs-Listen
• Beispiel-Datensätze
• Anleitungen mit Übungen
• Mailinglisten und Foren
Metadatenstandards kennenlernen
100 1 $aMerkl,
Christian$0(DE-
601)533312205$0
(DE-
588)133059545
Seite 46
47. • Metadatenstandards sorgen für die Konsistenz der Metadaten und verbessern
damit Nutzung und Austausch
• Ein Metadatenstandard ist aufgebaut aus Metadaten-Elementen (Eigenschaft /
Merkmal einer Ressource; property)
• Metadatenelemente werden definiert hinsichtlich ihrer Bedeutung (Semantik)
und hinsichtlich der Form (Syntax)
• Es gibt Vocabulary Encoding Schemes (Klassifikationen, Thesauri,
kontrolliertes Vokabular, Normdateien, Schlagwortlisten)
• und Syntax Encoding Schemes (Normen, URIs, weitere Identifier) zur
genaueren Definition von Metadatenelementen
• Zur Definition eines Elements gehört auch eine Aussage über die
Wiederholbarkeit und Verpflichtung eines Elements, sowie darüber, wie
einzelne Elemente miteinander in Beziehung stehen.
Seite 47
Zusammenfassung: Metadatenstandards
48. • Metadatenstandard ist nicht gleich Metadatenformat: ein Standard (z.B. Dublin
Core) kann in verschiedenen Formaten auftreten: z.B. DC-HTML, DC-XML,
DC-RDF
• XML eignet sich, weil es menschenlesbar und gleichzeigt maschinelesbar ist,
weil es gut für hoch-strukturierte Daten einsetzbar ist und weil es flexibel ist, da
die Tags nicht festgelegt sind.
• Einige Standards weisen spezielle strukturelle Besonderheiten auf: Subfields,
Indikatoren, externe und interne Sichten.
• Es gibt eine Vielzahl von Standards je nach Einsatzzweck und/oder Typ der
Ressource
• Wenn man Standards kennenlernen möchte, bedient man sich der Standard-
Dokumentationen
Seite 48
Zusammenfassung: Metadatenstandards
50. PPN
Titel
Verfasser Sonst. Beteil.Person
Umfang
ISBN
Schlagwörter
Fussnoten
Verwandte Ressourcen
URL
Metadaten-Standard einer „Community“ / Domain,
z.B. PICA, Dublin Core, DDI etc.
DOI
Tongeschlecht
Epoche
Bildformat
Anzahl Pixel
Primärkörperschaft
Format
URN
Kompression
Handle
Regie
Metadatenstandard und Metadatenschema
Metadatenformat
/-Schema einer
bestimmten
Anwendung, z.B.
Repository für
Publikationen
Metadaten-
Elemente
einer realen
Informations
-einheit
Titel:
Verfasser:
Sonst. Personen:
Körperschaft:
Erschienen:
Umfang:
Anmerkung:
ISBN:
Schlagwörter:
URL:
Seite 50
51. Metadaten-Dokumentation für individuelle Anwendungen:
Application Profiles
“In DCMI usage, an application profile is a declaration of the metadata terms an organization,
information resource, application, or user community uses in its metadata. In a broader sense, it
includes the set of metadata elements, policies, and guidelines defined for a particular application or
implementation. […] An application profile is not considered complete without documentation that
defines the policies and best practices appropriate to the application.” (DCMI Glossary)
Application Profile (AP): Metadaten-Profil, -schema einer bestimmten Anwendung,
das Elemente aus einem oder mehreren Standards enthält
Festlegung der
• Elemente
• Unterfelder/Refinements
• Encoding Schemes
• Wiederholbarkeit
• Pflichtfelder
Dokumentation der
• Struktur
• Richtlinien
• Best Practice
http://www.dlib.org/dlib/june06/chan/06chan.html
Seite 51
52. AP - Grundsätzliche Überlegungen
Welchen Zweck hat die Anwendung?
• Verwaltung von Daten für den
“Hausgebrauch”?
• Organisations-übergreifender
Datenaustausch?
• Integration der Daten in
Webdienste?
• …
Welche Funktionen soll die
Anwendung unterstützten?
• Erweiterte Suche?
• Browsing?
• Facetten?
• …
Was für Objekte werden beschrieben?
• Text, Personen, Filme …?
• …
Welche Beziehungen gibt es zwischen
den Objekten?
• Ist Urheber von …
• Ist Teil von …
• …
Was brauche ich, um meine Ziele und
Anforderungen umzusetzen?
• Welche Metadatenterme?
• Was für Encoding Schemas?
• Was für Einschränkungen?
Seite 52
53. Praxis – Kriterien für die Formatauswahl
Erst prüfen
• Gibt es für meine Anwendung
bereits einen Standard?
• Welcher Standard wird in meiner
Community genutzt?
• Welcher Standard passt zu meiner
Anwendung / in meinem Kontext?
• Welcher Standard entspricht am
ehesten meinen Anforderungen?
– “Use elements and qualifiers to meet the needs of your local context, but ...
– remember that your metadata may be interpreted by machines and people, so ...
– consider whether the values you use will aid discovery outside your local context.“
Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)
Seite 53Metadata Madness wheel, Musebrarian, http://www.flickr.com/photos/musebrarian/3289649684/
54. Praxis – Kriterien für die Auswahl des/der Standard(s)
– “Use elements and qualifiers to meet the needs of your local context, but ...
– remember that your metadata may be interpreted by machines and people, so ...
– consider whether the values you use will aid discovery outside your local context.“
Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)
Daran denken
• Auswahlkriterien: Anforderungen und Nachnutzbarkeit der Anwendung
• Dokumentation ist wichtig
• Verletze niemals die semantischen Grenzen eines Standards
Ja! zur semantischen Verfeinerung
Nein! zur semantischen Erweiterung
Seite 54
55. dcterms.creator
Application Profile - Namensräume
DCMI namespace: "a collection of DCMI terms URIs“ (DCMI term URI: "The
URI that identifies a term..“)
„The purpose of an application profile is to adapt or combine existing schemas into
a package that is tailored to the functional requirements of a particular application,
while retaining interoperability with the original base schemas.“ Weibel, S. et.al. (2002)
55
dc.creator
Seite 55
56. Application Profile - Namensräume
Namensräume: können für spezifische Anwendungen definiert werden
Die Deklaration von Namensräumen erlaubt Designern von Metadaten-Schemas den
Kontext, in dem ein bestimmtes Element verwendet wird, genau zu benennen und
sichert zu, dass dieses Element im Namensraum eindeutig ist.
dc
dc.titel
dc.creator
dc.subject
dc.description
dcterms
dcterms.dateIssued
dcterms.abstract
dcterms.coverage
dcterms.spatial
vascoda
vap.placeOfPublication
vap.edition
vap.thematic
vap.ddc
meinAP
dc.titel
dc.creator
dc.Subject
dcterms.dateIssued
dcterms.abstract
dcterms.coverage
vap.placeOfPublication
vap.edition
vap.thematic
vap.ddc
Namensräume
Namespace Policy for the Dublin Core Metadata Initiative (DCMI)
http://www.dublincore.org/documents/dcmi-namespace/
Seite 56
57. Application-Profile - Singapore Framework
„...a framework for designing metadata applications for maximum interoperability
and for documenting such applications for maximum reusability.“
(http://dublincore.org/architecturewiki/SingaporeFramework/)
• Das Singapore Framework für Dublin-Core-Anwendungsprofile nennt die
Rahmenbedingungen um Metadatenanwendungen möglichst interoperabel zu
gestalten und so zu dokumentieren, dass sie nachnutzbar sind.
• Es definiert die Komponenten, die erforderlich und hilfreich sind, um ein
Anwendungsprofil (Application Profile) zu dokumentieren.
• Das Singapore Framework ist die Grundlage für die Beurteilung von
Anwendungsprofilen in Hinblick auf Vollständigkeit der Dokumentation und auf
Übereinstimmung mit den Prinzipien der Web-Architektur.
Seite 57
59. Zusammenfassung: Application Profile
• Metadatenschemas, bzw. -profile bestehen aus Elementen aus einem oder
mehreren Metadatenstandards
• Ein Applikation Profile ist die Festlegung der einsetzbaren Elemente und deren
Bedingungen (Encoding Schemes, Wiederholbarkeit, Verpflichtung, etc.) sowie
der zu nutzenden Richtlinien.
• Grundsätzliche Überlegungen: Zweck der Anwendung, Funktionen der
Anwendung, beschriebene Objekte und Beziehungen zwischen Ihnen.
• Man sollte eingeführte Standards nachnutzen und kann auch mehrere
Standards kombinieren.
• Um Elemente aus verschiedenen Standards eindeutig benennen zu können
werden Namenräume (namespaces) verwendet.
• Eine Handreichung zur Erstellung optimaler Application Profiles bietet das
Singapore Framework der DCMI.
Seite 59
60. Application Profile
„The main goal of application profiles is to increase the
"semantic interoperability" of the resulting metadata
instances within a community of practice, by going
beyond the universal consensus of a single standard,
without compromising the basic interoperability that
the standard enables across the boundaries of these
communities.“
[Special section on semantic interoperability in global information systems,
ACM SIGMOD Record, Vol. 28, No. 1, March 1999.]
Seite 60
61. Interoperabilität
Interoperabilität ist die Fähigkeit unterschiedlicher Informationssysteme
miteinander zu kommunizieren und so Metadaten möglichst effizient und sinnvoll
und mit einem minimalen Verlust an Information auszutauschen.
systemübergreifender Austausch von Metadaten unter möglichst geringem
Aufwand.
Problem:
Austausch oder Integration von Daten, die in
verschiedenen Standards vorliegen
Seite 61
62. 62
Interoperabilität
Strukturelle Interoperabilität
• gegeben, wenn unterschiedlichen
Metadatenschemas ein gemeinsa-
mes Datenmodell zugrunde liegt
(z. B. DCMI Abstract Model, FRBR).
Syntaktische Interoperabilität
• gegeben, wenn unterschiedliche
Metadaten-Schemas in einer
gemeinsamen Kodierungssyntax
(z. B. XML, RDF) wiedergegeben
werden.
Semantische Interoperabilität
• gegeben, wenn unterschiedliche
Metadatenschemas ein
gemeinsames Vokabular
(Metadatenstandard) verwenden
Seite 62
63. Interoperabilität - Übung
001@ $026$aU
001A $00206:04-03-09
001B $00206:10-03-09$t10:42:23.000
001D $00206:04-03-09
001U $0utf8
001X $00
002@ $0Asu
003@ $0592906469
010@ $aeng
011@ $a2008
021A $aEscaping the unemployment trap$dthe case of
East Germany$hChristian Merkl; Dennis J. Snower
027D/00 $aJournal of comparative
economics$pAmsterdam$nElsevier$00147-5967$z7153508
028A $dChristian$aMerkl$9533312205$8Christian@Merkl
; PND-ID: 133059545
028B/01 $dDennis J.$aSnower$9366752960$8Dennis
J.@Snower ; PND-ID: 124825109
031A $d36$j2008$e4$c12$h542-556
034M $agraph. Darst.
039B $cIn$9130445541$8Journal of comparative
economics. - Amsterdam :
Elsevier$x200800000360004458
039B $cIn$7!562253327!
045D/00 $9091374367$8Langzeitarbeitslosigkeit
045D/49 $b49
101B $004-03-09$t09:15:56.000
Pica+
MODS
Seite 63
Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht
interoperabel?
64. Interoperabilität - Lösung
001@ $026$aU
001A $00206:04-03-09
001B $00206:10-03-09$t10:42:23.000
001D $00206:04-03-09
001U $0utf8
001X $00
002@ $0Asu
003@ $0592906469
010@ $aeng
011@ $a2008
021A $aEscaping the unemployment trap$dthe case of
East Germany$hChristian Merkl; Dennis J. Snower
027D/00 $aJournal of comparative
economics$pAmsterdam$nElsevier$00147-5967$z7153508
028A $dChristian$aMerkl$9533312205$8Christian@Merkl
; PND-ID: 133059545
028B/01 $dDennis J.$aSnower$9366752960$8Dennis
J.@Snower ; PND-ID: 124825109
031A $d36$j2008$e4$c12$h542-556
034M $agraph. Darst.
039B $cIn$9130445541$8Journal of comparative
economics. - Amsterdam :
Elsevier$x200800000360004458
039B $cIn$7!562253327!
045D/00 $9091374367$8Langzeitarbeitslosigkeit
045D/49 $b49
101B $004-03-09$t09:15:56.000
Pica+ (text)
MODS (xml)
Seite 64
Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht
interoperabel?
66. Was bedeutet „Mapping“?
Aufgabe: Integration heterogener Metadaten in einem System: EconBiz
Dublin Core (XML)
PICA 3
Titel=4000
Titel=<title>
• Metadaten verschiedener
Provenienz, die in verschiedenen
Formaten vorliegen
• Mittels Suchmaschine-Technologie
unter einer Oberfläche durchsuchen
• Verfeinerung per Drill-Down
Seite 66
67. • „Übersetzen“ der Elemente und Regeln von einem Standard (Schema /
Format) in einen anderen
• Mapping: die sich entsprechenden Bestandteile zweier unterschiedlicher
Metadaten-Standards oder -schemata miteinander in Beziehung setzen samt
Regeln
• Metadata "mapping" refers to a formal identification of equivalent or nearly
equivalent metadata elements or groups of metadata elements from different
metadata schemas, carried out in order to facilitate semantic interoperability
(Getty Glossary)
Element DB2 – MAB (Ziel) DB1 – PICA (Quelle) Anmerkungen
Bezeichner Syntax Bezeichner Syntax Anweisung für Transformation
Verfasser 100 Nachname, Vorname 3000 Vorname@Nachname
Quell-Wert vor Klammeraffen in Zielformat mit
Komma Leerzeichen hinter Quell-Wert nach
Klammeraffen schreiben, […]
[…]
Seite 67
Was bedeutet „Mapping“?
68. Seite 68
Crosswalk
“A table that maps the relationships and equivalencies
between two or more metadata schemes. Crosswalks
or metadata mapping support the ability of search
engines to search effectively across heterogeneous
databases”. http://dublincore.org/documents/usageguide/glossary.shtml#C
69. Crosswalk
A crosswalk ist "a mapping of the elements,
semantics, and syntax from one metadata scheme
to those of another„.
(http://www.niso.org/publications/press/Understandin
gMetadata.pdf ).
Crosswalks sind laterale Mappings, d.h. sie sind
Einbahnstrassen von einem Schema in das andere.
Seite 69
70. Einige Problemfelder beim Mappen:
• Mapping zwischen zwei unterschiedlich mächtigen Standards / Schemas:
fehlende Felder im Zielformat / mehr als ein Feld im Zielformat
• Unterschiedliche Eigenschaften: Einige Felder können als obligatorisch
(Pflichtfeld) und andere als optional deklariert werden. Das wiederholte
Vorkommen eines Elements kann zulässig sein oder nicht (Wiederholfähigkeit).
• Unterschiedliche Syntax der Felder (unterschiedliche syntax encoding
schemes): (z.B. A: „Vorname“, „Nachname“ und B: „Name“ (Nachname,
Vorname) und C: „Vorname@Nachname“)
• Verschiedene terminologische Vokabulare (unterschiedliche vocabulary
encoding schemes): Werden unterschiedliche Vokabulare (z.B. Klassifikationen)
verwendet müssen, diese ebenfalls „übersetzt“ werden (Cross-Konkordanz).
Mapping in der Praxis - Problemfelder
Seite 70
71. Mapping in der Praxis
In welcher Beziehung stehen die zu mappenden Elemente zueinander?
Grad der strukturellen Übereinstimmung:
• 1:1 one-to-one
• 1:n one-to-many
• n:1 many-to-one
• 1:0 one-to-none
Grad der semantischen Übereinstimmung:
• = äquivalent
• > Oberbegriff
• < Unterbegriff
• ≈
Seite 71
72. Mapping in der Praxis
=
"is the same as„
Semantik des Quell- und des Zielformats stimmen überein.
Einfaches Element-to-Element-Mapping (Aber: Encoding Scheme beachten!)
<dcterms:abstract> DC-Definition: A summary of the resource
<mods:abstract> MODS-Def.: a summary of the content of the resource
Quelle Ziel
Seite 72
<dc:language>Deutsch</dc:language> <mods:languageTerm type= "code" authority="iso639-2b">
ger</mods:languageTerm>
73. <
Quell-Element ist „Unterbegriff“ des Zielelements
Semantik des Quellelements ist enger gefasst, als die des möglichen Zielelements.
Quelle Ziel
<mods:relatedItem type=„isReferencedBy>
</relatedItem>
<dc:relation></dc:relation> DC-Definition: A related resource.
MODS-Definition: Citations or references
to published bibliographic descriptions,
reviews, abstracts, or indexes of the
content of the resource
Mapping in der Praxis
Seite 73
74. Mapping in der Praxis
>
Quell-Element ist „Oberbegriff“ von Ziel-Element
Semantik des Quellelements ist breiter gefasst, als die des Zielelements.
<dc:subject> DC-Def.: „The topic of the resource.“ (nicht eingeschränkt;
Geographika, Sachschlagwörter, Zeitschlagwörter etc.)
<mods:subject> MODS-Def: "topic" is used as the tag for any topical subjects
<mods:topic> that are not appropriate in the <geographic>, <temporal>,
<titleInfo>, or <name> subelements
nicht zulässig!
Quelle Ziel
Seite 74
75. Mapping in der Praxis
Quellformat: MIX
<Compression>
<CompressionScheme>1</CompressionScheme>
<CompressionLevel>10</CompressionLevel>
</Compression>
Zielformat: Dublin Core:
?
nicht möglich
Informationsverlust!
http://commons.wikimedia.org/wiki/File:Rotten_apple.jpg
Seite 75
1:0
Im Zielstandard gibt es kein Feld, das mit der Semantik des Quellelements
übereinstimmt.
76. Mapping in der Praxis
1:n
Quell-Element muss auf zwei oder mehrere Ziel-Elemente verteilt werden /
Nur Teil eines Quellelements kann auf Ziel-Element gemappt werden
<gils:ContactName> The name of the person acting as contact for the
information resource.
<name type="personal">
<namePart type="given"></namePart>
<namePart type="family"></namePart>
</name>
Transformationsregel angeben: anhand Syntax der
Werte nach möglichen Trennzeichen (Steuerzeichen)
suchen
http://commons.wikimedia.org/wiki/File:Apfelteiler_fcm.jpg
Seite 76
77. n:1 Mehrere Quell-Elemente entsprechen Ziel-Element
Nur zwei oder mehr verschiedene Informationen gemeinsam ergeben die Zielsemantik
Mapping in der Praxis
<part>
<detail type="volume">
<number>24</number> Band
</detail>
<detail type="issue"> Heft
<number>2</number>
</detail>
<extent unit="page"> Seitenangabe
<start>23</start>
<end>45</end>
</extent>
</part>
<dc:bibliographicCitation> Definition: A bibliographic reference for the resource.
Comment: Recommended practice is to include sufficient bibliographic
detail to identify the resource as unambiguously as possible.
Seite 77
Regel mit welchen Steuerzeichen die
einzelnen Werte im Ziel-Element zusammen-
gesetzt werden sollen
http://commons.wikimedia.org/wiki/File:Fruit_salad_%281%29.jpg
78. Mapping in der Praxis
Wiederholbarkeit
Quell-Element ist wiederholbar, Ziel-Element nicht
Alle Werte des Quell-Elements in Ziel-Element mappen. Dabei Trennzeichen als
Regel angeben
Seite 78
Quell-Element ist nicht wiederholbar, Ziel-Element ist wiederholbar
Trennzeichen im Quell-Elements als Steuerzeichen für Zerlegung des
Feldwerts nutzen
dc:subject: Begriff1
dc:subject: Begriff2
dc:subject: Begriff3
<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme>
Regel: alle Begriffe aus dc:subject in <ex:theme>
mit Leerzeichen Semikolon Leerzeichen getrennt
<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> dc:subject: Begriff1
dc:subject: Begriff2
dc:subject: Begriff3
Regel: Trenne die Begriffe in <ex:theme> anhand
Steuerzeichen (Leerzeichen Semikolon Leerzeichen)
79. Mapping in der Praxis
Verpflichtung
Quell-Element ist Pflichtfeld, Ziel-Element nicht
Kein Problem
Quell-Element ist nicht verpflichtend; Zielelement ist Pflichtfeld
Versuchen passende Werte aus einer Kombination von Quell-
Elementen zu generieren. Wenn nicht möglich , Mapping nicht
möglich.
Seite 79
80. Mapping in der Praxis
Probleme mit den Daten:
1. Missing data: Werte sind nicht vorhanden
2. Incorrect data: Werte entsprechen nicht den Konventionen
3. Confusing data: unzulässige / fehlende Trennzeichen, eingebettete HTML-Tags
4. Insufficient data: fehlende Angabe welches kontrollierte Vokabular, Format etc.
verwendet wird.
Iterativer
Prozess
Daten-
analyse
Mapping
Konver-
tierung
Kontrolle
Seite 80
81. Zusammenfassung: Mapping und Crosswalks
• Beim Mappen wird semantische, syntaktische und strukturelle
Interoperabilität hergestellt.
• Voraussetzung für ein korrektes Mapping ist die klare und präzise Definition
der Elemente in den jeweiligen Standards.
• Das Mapping sollte das Erstellen von Transformationsregeln ermöglichen,
mit denen sich die Daten aus dem einen Schema möglichst vollständig in das
andere Schema überführen lassen.
• Eigentliches Konvertieren der Daten mittels programmiertem Script
• Mapping ist der erste Schritt zur Integration heterogener Daten in einem
System
Seite 81
82. Mapping - Übung
Seite 82
Quelle: MODS-Schema:
Element language mit
encoding scheme
Soll nach PICA (GBV) gemappt
werden!
Aus der GBV-
Katalogisierungsrichtlinie:
<language>
<languageTerm type="code" authority="iso639-1">
de
</languageTerm>
</language>
Die Kategorie 1500 enthält Angaben zur Sprache des
vorliegenden Textes in codierter Form. Die Codierungen
erfolgen nach ISO 639-2, vgl. Anhang 2. Bei Neuaufnahmen
im System ist die Angabe der Sprachbezeichnung verbindlich.
Fragen:
Was muss man beim Mapping beachten? Ist ein Mapping möglich?
83. Mapping - Lösung
Seite 83
Antwort:
Ja, ein Mapping ist möglich: die Semantik der Felder in den beiden
Schemas stimmen überein.
Aber: das Vokabular muss „übersetzt“ werden. Anhand einer
Konkordanz zwischen ISO 639-1 und ISO 639-2 müssen die Werte
konvertiert werden.
de ger
84. Zusammenfassung: Mapping und Crosswalks
Seite 84
“A crosswalk is a specification for mapping one
metadata standard to another. Crosswalks provide
the ability to make the contents of elements
defined in one metadata standard available to
communities using related metadata standards.
Unfortunately, the specification of a crosswalk is a difficult and error-prone task
requiring in-depth knowledge and specialized expertise in the associated metadata
standards. Obtaining the expertise to develop a crosswalk is particularly
problematic because the metadata standards themselves are often developed
independently, and specified differently using specialized terminology, methods
and processes. Furthermore, maintaining the crosswalk as the metadata standards
change becomes even more problematic due to the need to sustain a historical
perspective and ongoing expertise in the associated standards.”
http://www.niso.org/publications/white_papers/crosswalk/
86. Schnittstellen
Softwareschnittstellen / softwareseitige Datenschnittstellen :
• definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und
Komponenten ausgetauscht werden
• Z39.50:
• Netzwerkprotokoll, das
• im Bibliothekswesen Standard zur Abfrage von bibliographischen
Informationssystemen
• Mit dem Zusammenführen der Daten hat die Bedeutung der Abfrage von
verteilten Informationssystemen mit Z39.50 abgenommen
• SRU:
• Nachfolger von Z39.50
• HTTP-basierte Protokoll Search/Retrieve via URL (SRU/SRW),
• Techniken basieren auf etablierten Internet-Standards wie URI und XML
Seite 86
87. 87
Linkresolver
• System zur Verfügbarkeitsanzeige wissenschaftlicher Publikationen.
• HTTP-basierter Service
• Metadaten der Quelle (Source) + gespeicherte Informationen über lokale Bestände
und Lizenzen
• Links auf "passende" Dienste wie elektronische Volltexte, Dokumentenlieferdienste,
den lokalen OPAC und den Buchhandel
Link-Resolver
http://www3.interscience.wiley.com/resolve/openurl?
genre=article
&issn=0022-2380
&volume=30
&issue=6
&spage=1017
OpenURL
Seite 87
88. openURL
„The OpenURL is a protocol for interoperability between an information resource
and a service component that offers localized services in an open linking
environment. It is in effect an actionable URL that transports metadata or keys to
access metadata for the object for which the OpenURL is provided. „
(http://www.oclc.org/research/projects/openurl/default.htm)
• Standard ANSI/NISO Z39.88
• ANSI/NISO Z39.88 - The OpenURL Framework for Context-Sensitive Services
• Pflege und Entwicklung OCLC
• Key-Encoded Value Guidelines:
http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html
Seite 88
89. openURL
Standard für die Übermittlung von bibliographischen Metadaten
(Context-Sensitive Linking)
http://openurlgw.hbz-nrw.de/gw
?aulast=Clark
&aufirst=Timothy
&au=Wright%2C+Mike
&atitle=So%2C+Farewell+Then+.+.+.+Reflections+on+Editing+the+Journal+of+M
anagement+Studies
&jtitle=Journal+of+management+studies+%3A+JMS
&stitle=J.+Manage.+Stud.+(GB)
&date=2009
&volume=46
&issue=1
&pages=1-9
&issn=00222380
&coden=JMASB2
&genre=article
Seite 89
90. OAI-PMH - OAI Protocol for Metadata Harvesting
Open Archives Initiative (OAI):
• Initiative von Betreibern von Dokumentenservern, um die abgelegten
elektronischen Publikationen besser auffindbar und nutzbar zu machen
• OAI Protocol for Metadata Harvesting (OAI-PMH) zum Einsammeln
(Harversting) und Weiterverarbeiten von Metadaten
• Metadaten werden von Data Providern bereitgestellt
• Geharvestete Datensätze werden von Service Providern aufbereitet und
bereitgestellt
• kleinster gemeinsamer Nenner: Dublin-Core-Datenmodell
• Erweiterung mit zusätzlichen Standards (z.B. MODS, MARC mittels MARCXML)
empfohlen
• http://www.openarchives.org/pmh/
Seite 90
91. OAI-PMH - OAI Protocol for Metadata Harvesting
OAI-Anfrage an EconStor
http://www.econstor.eu/dspace-oai/request?
verb=GetRecord&metadataPrefix=didl&identifier=oai:econstor.eu:10419/41393
Seite 91
92. 92
OAI-PMH - OAI Protocol for Metadata Harvesting
http://www.econstor.eu/dspace-oai/request?
verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:econstor.eu:10419/41393
Seite 92
93. 93
OAI-PMH - OAI Protocol for Metadata Harvesting
6 verbs um ein Repository abzufragen:
• GetRecord: individuellen Datensatz abfragen
• Identify: Information über Repository
abfragen
• ListRecords: um Datensätze zu harvesten
• ListIdentifiers: Abkürzung von
ListRecords: man bekommt nur header;
nicht Datensätze
• ListMetadataFormats: die zur Verfügung
stehen Metadatenformate abfragen
• ListSets: Kollektionen eines Repositorys
abfragen
Seite 93
96. COinS (ContextObjects in Spans)
• Methode zur Einbindung von bibliographischen Metadaten in HTML-Seiten
• Basiert auf OpenURL
• Browser-Plugins / weitere Programme können aus den „unsichtbaren“ COinS im
Quelltext einer Webseite
• OpenURL-Links für einen Linkresolver erzeugen
• Metadaten auslesen (Literaturverwaltung)
• Prinzip: Mikroformat
Schnittstellen für Literaturverwaltung
Seite 96
97. Zusammenfassung: Schnittstellen
Seite 97
• Schnittstellen definieren, wie Kommandos und Daten zwischen verschiedenen
Prozessen und Komponenten ausgetauscht werden
• Ein Linkresolver ist eine "Allround-Schnittstelle" zur Anzeige von Verfügbarkeits-
informationen.
• OpenURL nutzt für jedes Dokument einen abstrakten Namen, der durch einen
Mechanismus zu einer URL aufgelöst wird (Actionable URL)
• Key-Encoded-Values: einem Schlüssel (Element) wird ein Wert zugeordnet
• OAI-PMH: OAI Protocol for Metadata Harvesting: Schnittstelle zum Harvesten
von Metadaten von Dokumentenservern
• Dublin-Core-Datenmodell
• häufig zusätzliche Standards
• Metadaten für die Literaturverwaltung:
• RIS, BibTeX, EndNote, Mikroformat COinS
99. Metadaten für das Semantic Web
Problem heutiger Suchmaschinen
1. Unpassende Suchergebnisse
Suchanfrage ist mehrdeutig
(Homonymie / Polysemie)
2. Fehlende Suchergebnisse
Synonyme werden bei Suche nicht
berücksichtigt
z.B. Suche nach „Zukunftsforschung“ findet nicht
„Futorologie“, „future studies“
Ursache
• Mangel an expliziter Semantik
Seite 99
100. 100
Mikroformate: semantische Annotation
• Formate zur »Feinstrukturierung« von Webseiten.
• (X)HTML-Dokumente menschen- und maschinenlesbar mit Infos ergänzt
• Mikroformate nutzen vorhandene XHTML-Attribute
• Informationen lassen sich aus einer Website extrahieren und anderen
Programmen zugänglich machen
• Domain-spezifische Vokabulare: Termine, Kontaktinformationen, soziale
Beziehungen.
• http://microformats.org/
Seite 100
BEGIN:VCALENDAR
VERSION:2.0
PRODID:http://www.example.com/calendarapplication/
METHOD:PUBLISH
BEGIN:VEVENT
UID:461092315540@example.com
ORGANIZER;CN="Alice Balder, Example
Inc.":MAILTO:alice@example.com
LOCATION:Somewhere
SUMMARY:Eine Kurzinfo
DESCRIPTION:Beschreibung des Termines
CLASS:PUBLIC
DTSTART:20060910T220000Z
DTEND:20060919T215900Z
DTSTAMP:20060812T125900Z
END:VEVENT
END:VCALENDAR
101. • Microdata erweiterte Microformats und überwindet deren Schwächen (z.B. unflexibel)
• Ausdruckstärkere semantische Annotation von Webseiten
• Specification: http://www.w3.org/TR/microdata/
• Attributerweiterung für HTML5: itemprop, itemref, itemtype,
itemscope, ..
Microdata: Schema.org
Seite 101
• 2011: Initiative der
Suchmaschinenbetreiber
Google, Bing, Yahoo,
Yandex: schema.org
• “create and support a
common set of schemas
for structured data
markup on web pages.”
• Nutzen für Fachportal
EconBiz: Verbesserte
Verbreitung der Meta-
daten
103. Semantic Web
Tim Berners Lee (1998): Semantic Web Roadmap:
“The web was designed as an information space, with the goal
that it should be useful not only for human-human communication,
but also that machines would be able to participate and help.”
http://www.w3.org/DesignIssues/Semantic.html
Nur möglich, wenn die Information von Maschinen gelesen und
interpretiert werden kann
Heute:
• Versuch die Bedeutung einer Information zu extrahieren
• Fehleranfällig
Semantic Web:
• Web Content in natürlicher Sprache wird explizit mit
semantischen Metadaten ausgezeichnet
• Semantische Metadaten kodieren die Bedeutung des Inhalts in
maschinen-interpretierbarer Art
Seite 103
Tim Berners-Lee at Campus Party Brasil, 2009,
http://commons.wikimedia.org/wiki/File%3ATim_Berners-Lee_CP.jpg
104. Semantic Web
Erweiterung des World Wide Web:
Seite 104
„Im Web werden immer mehr veröffentlichte Daten in RDF (s.u.) vorliegen, d.h. sie
folgen denselben Standards und können daher frei miteinander kombiniert und
verlinkt werden. So entsteht das Semantic Web als eine verteilte Datenbank, die
komplexe Abfragen und Schlussfolgerungen über dezentral vorliegende Daten
ermöglicht.“
Linked Data und die Bibliothekswelt
Adrian Pohl (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen)
http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf
105. formale Sprache für die Bereitstellung von Metadaten im WWW
Umgesetzt werden diese Beschreibungen nach dem RDF-Modell entweder als
Graph oder nach der RDF-Syntax als XML.
Eine Ressource (z.B. eine Monographie) wird durch eine bestimmte Eigenschaft
(property) bzw. Relation beschrieben. Diese Eigenschaft kann einen bestimmten
Wert annehmen.
Das Kapital „Marx, Karl“
hatAutor
Ressource Eigenschaft Wert
RDF - Resource Description Framework
Subjekt Prädikat Objekt
http://d-nb.info/gnd/4099309-7 dc.creator „Marx, Karl“
http://d-nb.info/gnd/4099309-7 dc.creator http://d-nb.info/gnd/118578537
Subjekt muss URI (Uniform Resource Identifier) sein, Objekt kann eine weitere
URI oder ein String (Zeichenkette) sein
Seite 105
Tripel
106. Ressource - URI - Repräsentation
Seite 106
Repräsentation: Webseite über
St. Michaelis
http://dbpedia.org/resource/
St._Michaelis_Church,_Hamburg
URI: Identifier für St. Michaelis
Ressource: St. Michaelis
http://commons.wikimedia.org/wiki/File:Michel_-_Noord.jpg
• Uniform Resource Identifier (URI): Zeichenfolge, die zur Identifizierung einer
abstrakten oder physischen Ressource dient
• eindeutiger dauerhafter Identifikator einer Ressource
107. Ressource - URI - Repräsentation
Seite 107
« Ceci n'est pas une pipe » « Das ist keine Pfeife »
René Magritte: La trahison des images, 1928–29
Richtig! Das ist ein Bild einer Pfeife = Repräsentation
108. Bedeutung für Beschreibung von Bibliotheksressourcen: verschiedene
Metadatenstandards können in RDF integriert werden
„The Resource Description Framework (RDF) of the World Wide Web Consortium (W3C) is another
model that "provides a mechanism for integrating multiple metadata schemes" [NISO, 2004] for the
description of Web resources. It is a data model that provides a framework within which independent
communities can develop vocabularies that suit their specific needs and share vocabularies with
other communities. It utilizes the XML namespace to effectively allow RDF statements to reference a
particular RDF vocabulary or schema. „Zeng, M.L.; Chang, L.M. , http://www.dlib.org/dlib/june06/zeng/06zeng.html
Beispiel DC-RDF:
Die Ressource
‚http://ilrt.bristol.ac.uk/people/cmdjb/‘
hat den Titel ‚Dave Beckett´s
Homepage‘ und hat den Autor
‚Dave Beckett‘, hat Herausgeber
‚ILRT; University of Bristol‘ und hat
das Erstellungsdatum ‚31.7.2002‘
RDF - Resource Description Framework
Seite 108
109. 1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF
und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:
RDF - Resource Description Framework - Übung
Seite 109
Subjekt Prädikat Objekt
Harry Potter wird verlegt bei Carlsen
2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel
(URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
dc:date
dc:creator
dc:titledc:identifier
dc:contibutor
Eigenschaften
ID: http://d-nb.info/990563480
Titel: Metadata for semantic and
social applications
Verfasser: Greenberg, Jane
(http://d-nb.info/gnd/136971857)
Jahr: 2008
110. 1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF
und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:
RDF - Resource Description Framework - Lösung
Seite 110
Subjekt Prädikat Objekt
Harry Potter wird verlegt bei Carlsen
http://d-nb.info/990563480
http://d-nb.info/990563480
http://d-nb.info/990563480
http://d-nb.info/gnd/136971857
“Metadata for semantic and
social applications”
Greenberg, Jane
ID: http://d-nb.info/990563480
Titel: Metadata for semantic and
social applications
Verfasser: Greenberg, Jane
(http://d-nb.info/gnd/136971857)
Jahr: 2008
dc:date
dc:creator
dc:title
http://d-nb.info/990563480 „2008“
dc:creator
2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel
(URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
112. 112
SKOS – Simple Knowledge
Organisation System
• formale Sprache zur Kodierung von
Wissensorganisationssystemen wie
Ontologien, Thesauri, Klassifikationen,
Taxonomien, andere Arten von kontrolliertem
Vokabular
• baut auf dem Resource Description
Framework (RDF) und RDF-Schema auf
• skos:broader (Oberbegriffe)
• skos:narrower (Unterbergiffe)
• skos:related (verwandte Begriffe)
• …
Seite 112
113. Web of Linked Data
RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) +
URIs für Entitäten = Web of Data
Cool URIs don't change
What makes a cool URI?
A cool URI is one which does not change.
What sorts of URI change?
URIs don't change: people change them.
http://www.w3.org/Provider/Style/URI
Seite 113
Semantic Web Stack
http://commons.wikimedia.org/wiki/File:Semantic_Web_Stack.png
114. 114
Daten für das Semantic Web veröffentlichen:
Linked (Open) Data
Grundsätze von Linked Data
1. Verwende URIs als Name für Objekte.
2. Verwende http-URIs, so dass andere den Namen nachschlagen können.
3. Wenn jemand einen Namen nachschlägt, stelle hilfreiche Informationen zur
Verfügung und benutze Standards (RDF, SPARQL).
4. Stelle Links zu anderen URIs bereit, so das man Weiteres entdecken kann.
On the Web
Machine-readable data
Non-proprietary format
RDF standards
Linked RDF
Linked Open Data (LOD) ist Linked Data, welche
unter einer offenen Lizenz veröffentlicht wird, die
eine freie Nachnutzung nicht behindert.
5 Stars of Linked Open Data:
Seite 114
116. Linked Data in Bibliotheken
Seite 116
Warum?
• Sichtbarkeit im Web
maximieren
• Bestände leichter auffindbar
machen
• Nachnutzbarkeit
sicherstellen: insbesondere
durch nichtbibliothekarische
Domänen
• Bibliographische Nachweise
durch die Verknüpfung mit
anderen Informationen
anreichern
• Recherchemöglichkeiten
optimieren
EconStor goes LOD
117. Linked Data in Bibliotheken
Bereitstellen und Nutzen von kontrollierten Vokabularen und
Ontologien in RDF
• DBPedia:
• Projekt der Universität Leipzig, FU Berlin und OpenLink Software
• strukturierte Informationen aus Wikipedia extrahieren und in RDF bereitstellen
• Dreh- und Angelpunkt der Linked Data Cloud
• http://dbpedia.org/
• Standard Thesaurus Wirtschaft: http://zbw.eu/beta/econ-ws/about
• Gemeinsame Normdatei der Deutschen Nationalbibliothek:
http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html
• ….
Bereitstellen und Nutzen von Titeldaten in RDF
• hbz: http://lobid.org/about
• B3Kat (BSB, KOBV): http://lod.b3kat.de/doc
• …
Seite 117
118. Linked Data in Bibliotheken
Bereitstellen von Tools
• Culturegraph: Plattform für Dienste und Projekte rund um die Themen
Datenvernetzung, Persistent Identifier und Linked Open Data für kulturelle
Entitäten
• http://www.culturegraph.org/
Internationalisierung der bibliothekarischen Regelwerke
• Resource Description and Access (RDA)
• Umsetzung geplant in D für 2015
• Format-unabhängig
• Entwicklung ausgerichtet auf Nutzung im Semantic Web
• FRBR- und RDA-Vokabular
Seite 118
119. 119
Metadata Registries
• Identifikation existierender Elemente verschiedener Schemas und Application Profiles
• Zur Nachnutzung und Konsultation bereitstellen
• Ermöglichen automatische Anfragen von Anwendungen, die die URIs, die einem
Schema enthalten sind, auflösen können.
“The presence of a metadata registry application promotes the wider adoption,
standardization and interoperability of metadata by facilitating its discovery, and reuse,
across diverse disciplines and communities of practice" [Dublin Core Metadata Registry].
http://rdvocab.info/
Seite 119
122. Zusammenfassung: Semantic Web
• Semantic Web: das „verstehende Web“: Informationen werden auf der Ebene
ihrer Bedeutung miteinander verknüpft.
• Voraussetzung:
• Maschinen-Interpretierbarkeit der Information RDF
• Eindeutigkeit eines Konzepts (einer Person, einer Körperschaft, eines
Themas) URI: Zeichenfolge, die zur dauerhaften Identifizierung einer
abstrakten oder physischen Ressource dient
• Vokabular zu Modellierung einer Ontologie: RDFS, OWL, SKOS
• RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für
Entitäten = Web of Data
• Bibliotheken nutzen und veröffentlichen Linked Open Data
• Recherche über Daten verschiedener Domänen
• Verbessert Nachnutzbarkeit
• Microformats und Microdata: „Semantic Web light“
Seite 122
124. • Unterstützung beim Aufbau und Pflege der
Informationssysteme des Informationszentrums
• Koordination der Datenlieferungen
• Hilfestellung in allen Fragen zu Metadaten-
Formaten und Standards
Metadaten-Management in der ZBW
Querschnittsaufgabe
Metadaten-Management
Seite 124
125. • Mitarbeit in Abteilungs-übergreifende Teams der ZBW
• Mitarbeit in Drittmittel-Projekten
• Enge Zusammenarbeit mit der Abteilung „Innovative Informations-
systeme & Publikationstechnologien“
• Mitarbeit in Kooperation und (internationalen) Arbeitgruppen
Metadaten-Management in der ZBW
Metadaten-Management
Seite 125
126. Aufgaben des Metadaten-Managements
Metadatenstandards und Mapping
• Expertise bzgl. Metadaten-Standards und Regelwerken
• Erarbeiten von Crosswalks
Entwicklung und Weiterentwicklung von Metadatenformaten
Neue Systeme:
• Auswahl geeigneter Metadatenstandards gemäß der Anforderungen
an das System, Ggf. Kombination mehrerer Standards
• Entwicklung eines interoperablen Schemas
• Erstellung von Application Profiles (Dokumentation)
Bestehende Systeme, Z.B. EconStor, da|ra:
• Kontinuierliche Weiterentwicklung angepasst an sich wandelnde
Anforderungen
Seite 126
127. Koordination von Datenlieferungen
Weitere Aufgaben des Metadaten-Managements
• Bereitstellung /
Auswertung von
Testdaten und
Dokumentationen
• Dokumentation von
eingehend und
ausgehenden
Datenlieferungen
• Ansprechpartnerin
für alle Fragen
bzgl.
Metadatenformat,
Katalogisierung
und Bereitstellung
Seite 127
128. Qualitätsmanagement und Weiteres
Weitere Aufgaben des Metadaten-Managements
• Mitarbeit System-Entwicklung: Funktionen, die auf Metadaten aufbauen, z.B.
„Ähnliche Titel“, Merkliste, Exporte in Literaturverwaltungsprogramme
• Weitere Fragestellungen:
• Heterogene Sacherschließung in EconBiz
• Dublettenproblematik: Wie erkennen wir Dubletten?
• Qualitätsmanagement:
• Erstellen von Statistiken
• Datenanalysen: z. B. Prüfung einzelner Kategorien auf zulässige Inhalte
• Datenanalysen: z.B. Stand der Normierung: hohe Bedeutung für das
Zusammenführen von Beständen mit gleichen Merkmalen und
Zukunftsfähigkeit der Metadaten
Seite 128
129. Anforderungen an Metadaten-Managerinnen und -
Manager
bibliothekarische
Metadatenstandards
Regelwerke und
Frameworks
Vokabulare und
Normen
Normdateien
RAK-WB
Seite 129
130. • Analytisches Denken
• Spaß daran, sich ständig mit neuen
Aufgaben (Standards, Technologien)
zu beschäftigen und weiterzubilden
Methoden
Best Practices
Auszeichnungs-
sprachen
Technologien
Hochspezialisierter Arbeitsbereich im Bibliothekswesen
Anforderungen an Metadaten-Managerinnen und -
Manager
Seite 130
132. I
LOVE
META
DATA
• Querschnittsaufgabe
• Kooperationen und Projekte
• Hoch-spezialisierter Arbeitsbereich
• Wissenschaftliche Bibliotheken: Zentrale Fachbibliotheken, Universitäts-
bibliotheken, Nationalbibliotheken, Verbundzentrale
• One-Person-Librarians
„Metadaten-Management? Wer muss das wissen?“
Bibliothek der Zukunft
Seite 132
l
Verweisung vom zweiten Bestandteil des
zusammengesetzten Namens
(§ 319)
Ist nach den Regeln ein zusammengesetzter Name in
der Ordnungsgruppe des Familiennamens
anzusetzen, so wird vom zweiten und von allen
weiteren Hauptbestandteilen des zusammengesetzten
Namens verwiesen.
Die bei der Verweisung übergangenen Teile des
zusammengesetzten Namens werden an das Ende
der Ordnungsgruppe der Vornamen gestellt (319,1).
l
RAK
133. Seite 133
Ausbildungsinhalte (2011/2012),
untersucht v. A. Schafrick
Bibliothek der Zukunft
Metadatenstandards
4
1
4
4
2
1
2
1
1
0
0
1
1
1
1
0
3
1
0
0
0
1
1
1
1
0
0
0
0 1 2 3 4 5 6 7
Nicht spezifizierte bibliothekarische
Metadatenformate
PICA +
PICA3
MAB2
MAB
MABxml
Marc21
ISBD
DC
TEI
VRA
ISAD G
EAD
Nicht spezifizierte archivarische
Metadatenformate
Wahlpflichtmodul
Pflichtmodul
Auswertung der Inhalte aus den jeweils aktuellsten
öffentlich zugänglichen Modulhandbüchern der
grundständigen Studiengänge in Deutschland im
Bereich Bibliothekswesen mit dem Bildungsziel
Bachelor of Arts (7 Hochschulen). Ergänzt um
Inhalte aus den Vorlesungsverzeichnissen WS
2011/2012 und SS 2012.
3
1
3
4
3
7
1
2
1
1
2
1
2
1
2
0
1
0
1
0
0
0
0 1 2 3 4 5 6 7
Forschungsdatenmanagement
Semantic Web (Linked Data,
Vokabulare, semantische
Persistent Identifer
(Systembeispiele, Aufgaben)
Digitale Langzeitarchivierung
(Archivierungsformate, ...)
Normierte Datenübergabe und -
integration in verteilten Systemen
Datenmodellierung/Datenmodelle
Aktuelle Entwicklungen bei
Standards zum Datenaustauch
Kommunikationsprotokolle (OAH
PMH, Z39.50)
Crosskonkordanzen, Terminologie
Mapping
Metdata-Crosswalks
Unterschiede Austauschformat,
Internformat …
Wahlpflichtmodul
Pflichtmodul
Seite 133
„Woher soll ich das wissen?“
134. Seite 134
„Metadaten-Management? Chancen?“
Bibliothek der Zukunft
Stellenanzeigen für Bibliothekarinnen und -Bibliothekare (Dipl. und B.A.)
in Bibliotheken des spezialisierten und hochspezialisierten im
deutschsprachigen Bereich vom 01.11.2011-30.04.2012 aus inetbib und
Bibliojobs
Seite 134
135. Automatisierung
• Automatische Indexierung und Klassifizierung
• Automatische Strukturerkennung von elektronischen Dokumenten
• Automatische Formalerschließung von elektronischen Dokumenten
• Schließen von Lücken bei Formal- und Sacherschließung
• Ergebnisse reichen derzeit nicht an intellektuelle Ergebnisse heran
• Semi-automatische Verfahren
• „Automatische Verfahren funktionieren nicht automatisch“
Entwickeln und Betreuen von automatischen Verfahren
„In der Bibliothek arbeiten bald nur noch Informatiker“
Bibliothek der Zukunft
Seite 135
136. Seite 136
„Wer geht denn in die Bibliothek? Ist doch alles im Internet“
Bibliothek der Zukunft
Seite 136
„Zur Bibliothek“, bmgnrs,
http://www.flickr.com/photos/gigl/4807897633/
http://www.wer-weiss-was.de/theme199/article7098730.html
138. What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/
beyondthepdf2_day1_hires.jpg
Metadaten:
• (semi-)automatisch erstellte
Metadaten
• Metadaten für das Semantic Web
• RDF, RDFS
• OWL
• SKOS
• Ontologien statt Schlagwortlisten
• Modellierung
Seite 138
139. What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/
beyondthepdf2_day1_hires.jpg
Forschungsdaten:
• Mitarbeit bei der Entwicklung von
Forschungsumgebungen
• Entwicklung von
Publikationsplattformen
• Unterstützung / Beratung der
Forscher
• Langzeitarchivierung, Dokumentation
und Verbreitung
• ganz praktisch: z.B. Normierung von
Entitäten
• Data Librarian: unterstützt bei
Recherche nach FD und bei der
Erstellung von Metadaten
Seite 139
140. What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/
beyondthepdf2_day1_hires.jpg
Informationssysteme:
• Integration von Metadaten aus
verschiedenen Domänen:
Bibliotheken, Museen, Archive, …,
Internet
• Erleichterte Verfügbarkeit für
elektronische Dokumente
(Rechtemanagement)
• Dienst dort bereitstellen, wo die
Nutzer sind: von Facebook bis
Forschungsumgebung
Seite 140
141. What is our role?
Bibliothek der Zukunft
Seite 141
142. Auf Du und Du mit Dublin Core & Co.
k.jeude@zbw.eu
„Metadata is a love note to the future”, Cea.,
https://secure.flickr.com/photos/centralasian/8071729256/in/photostream/ Seite 142
143. Seite 143
Literatur
Seite 143
Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997
http://www.w3.org/DesignIssues/
Brand, A., Daly, F., Meyers, B., & National Information Standards Organization (U.S.)(2003):Metadata
demystified: A guide for publishers. Bethesda, Md: NISO Press.
(www.niso.org/standards/resources/Metadata_Demystified.pdf )
Caplan, Priscilla: Metadata Fundamentals for All Librarians. Chicago, 2003, ALA Editions
Dublin Core Metadata Initiative: DCMI Glossary. http://dublincore.org/documents/usageguide/glossary.shtml
Foulonneau, Muriel; Riley, Jenn (2008): Metadata for digital resources: implementation, systems design and
interoperability. Oxford: Chandos.
Greenberg, J. (2008): Dublin Core History and Basics. Tutorial ASIST DC 2008 http://dc2008.de/wp-
content/uploads/2008/09/tutorial-1.pdf
Harper, Corey (2010): Dublin Core Metadata Initiative: Beyond the Element Set – NISO Information
Standards Quarterly, v.22, no. 1, Winter 2010. http://www.niso.org/publications/isq/2010/v22no1
Hillman, D. I., & Westbrooks, E. L. (2004). Metadata in Practice. Chicago: ALA Editions.
In Baca, M., & Getty Research Institute. (2008). Introduction to metadata. Los Angeles (Calif.: Getty Research
Institute.
Miller, Eric (1998): An introduction to the resource description framework. In: D-Lib Magazine, Volume 4 Issue
5, May 1998. http://www.dlib.org/dlib/may98/miller/05miller.html
Mitchell, Nicole: Metadata Basics (2066): In: The Southeastern Librarian, Vol. 54: Iss. 3, Article 6 .
http://digitalcommons.kennesaw.edu/seln/vol54/iss3/6/
144. Literatur
National Information Standards Organization (U.S.). (2004): Understanding metadata. Bethesda, MD: NISO
Press. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf )
Pohl, Adrian (2011): Linked Data und die Bibliothekswelt. Hochschulbibliothekszentrum des Landes
Nordrhein-Westfalen). http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-
data_ODOK.pdf
Riley, Jenn (2008-2010): Seeing Standards: A Visualization of the Metadata Universe.
http://www.dlib.indiana.edu/~jenlrile/metadatamap
Söllner, Konstanze (2008):„Academic Librarian of the Future“-Woher kommen die Spezialisten für die neuen
Aufgaben in den Bibliotheken?. 102. Deutscher Bibliothekartag <Leipzig, 2013> http://nbn-
resolving.de/urn:nbn:de:0290-opus-14644
St. Pierre, Margaret; LaPlant, William P. (1998): Issues in Crosswalking Content Metadata Standards.(NISO
White Papers). Bethesda, MD: NISO. http://www.niso.org/publications/white_papers/crosswalk/
Weibel, S. et.al. (2002): Metadata Principles and Practicalities. In: D-Lib-Magazin, Vol. 8, No. 4, April 2002
Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part
I: Achieving Interoperability at the Schema Level. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006.
http://www.dlib.org/dlib/june06/chan/06chan.html
Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part
II: Achieving Interoperability at the Record and Repository Levels. In: D-Lib-Magazin, Vol. 12, No. 6, June
2006. http://www.dlib.org/dlib/june06/zeng/06zeng.html
Zeng, Marcia Lei, Jian Qin (2008): Metadata. New York: Neal-Schuman Publishers.
Seite 144
145. Webressourcen
K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/
Blogs
Metadata Matters: Bloggerin: Diane Hillmann: http://managemetadata.com/blog/
Coyle's InFormation: Bloggerin: Karen Coyle: http://kcoyle.blogspot.de/
Managing Metadata: Bloggerin: Laura Smart: http://library.caltech.edu/laura/
Metadata Discussion Group (Indiana University Libraries):
https://blogs.libraries.iub.edu/metadata/
Fachjournale
Journal of library metadata. 2008. New York, NY: Haworth Press.
http://www.informaworld.com/smpp/title~db=all~content=t792306902 .
D-Lib-Magazin (frei): http://www.dlib.org/
Seite 145
146. Webressourcen
Fortbildung
K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/
Hyperlinked Library MOOC: http://slisweb.sjsu.edu/about-slis/news/detail/free-
online-course-extends-learning-individuals-across-globe
OpenHPI: (Hasso-Plattner-Institut für Informatik) https://openhpi.de/
Tools
Dublin Core Tools zur Erstellung / Bearbeitung: http://www.dublincore.org/tools/
Marc-Tools, wie z.B. MarcEdit: http://www.loc.gov/marc/marctools.html
Notepad++: Freier Text-Editor für große Dateien. Suchen und Ersetzen mit
regulären Ausdrücken möglich
Firefox-AddOns: Dublin Core Viewer, Operator (Mikroformaterkennung)
Chrome-AddOn: Schema Explorer (Mikrodata), OpenLink Data Explorer
Seite 146