SlideShare uma empresa Scribd logo
1 de 147
Baixar para ler offline
Die ZBW ist Mitglied der Leibniz-Gemeinschaft
Auf Du und Du mit Dublin Core & Co. –
Berufsfeld Metadaten-Management im Kontext der Bibliothek
der Zukunft
Kirsten Jeude
12.04.2013
Metadaten-Management im Leibniz-Informationszentrum Wirtschaft
„metadata“ Shira Golding, https://secure.flickr.com/photos/boojee/3743753784/in/photostream
Seite 2
Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-
Management im Kontext der Bibliothek der Zukunft
1. Was sind Metadaten?
2. Metadatenstandards (inkl. Exkurs XML)
3. Application Profiles und Interoperabilität
4. Mapping
5. Schnittstellen
6. Metadaten im Semantic Web
7. Metadaten-Management in der ZBW
8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der
Zukunft
Gliederung
1. Was sind Metadaten?
Seite 3
Was sind Metadaten?
Definitionen über Definitionen
• „… are (structured) data about data.“
Miller, Eric: An introduction to the resource description framework. In: D-Lib Magazine, (May) 1998; Foulonneau, Muriel; Riley Jenn
(2008): Metadata for Digital Resources; u.v.m.
• „Unter Metadaten ("Daten über Daten") versteht man strukturierte Daten, mit deren Hilfe eine
Informationsressource beschrieben und dadurch besser auffindbar gemacht wird.“
SUB Göttingen Metadata Server
• „… structured, encoded data that describe characteristics of information-bearing entities to
aid in their identification, discovery, assessment, and management of the described entities“
American Library Association´s Committee on Cataloguing
• „… is any type of formal description of a resource, regardless of format“
Mitchell, Nicole: Metadata Basics (The Southeastern Librarian, Fall 2006)
• „…is cataloging done by men“
Delsey, Tom, National Library of Canada
• „… is machine understandable information about web resources or other things.“
Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997.
• „An item of metadata is a relationship that someone claims to exist between two entities.“
Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources
• „I like to think of metadata as data which removes from a user (human or machine) the need
to have full advance knowledge of the existence or characteristics of things of potential
interest in the environment“
Lorcan Dempsey, zit. in: Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources
Seite 4
Metadata “is machine understandable information about
web resources or other things.“ (Tim Berners-Lee)
Web-Ressourcen:
Seite 5
Andere Dinge:
Bücher und Zeitschriften etc.:
Museums-Objekte:
Bilder:
Tonträger:
Personen:
Metadata “is machine understandable information about
web resources or other things.“(Tim Berners-Lee)
Seite 6
Karteikarte im Zettelkatalog
Metadaten – getrennt vom Objekt Metadaten – im Objekt enthalten
CIP (Cataloging in
Publication)
Datensatz in bibliographischer Datenbank
Header einer HTML-
Seite mit Metadaten
Metadata „is any type of formal description of a resource,
regardless of format“ (Nicole Mitchell)
Metadaten in
Form von COinS
(Mikroformat) in
HTML-Seite
Seite 7
Metadata „are (structured) data about data“ (Eric Miller)
Metadaten sind „Daten über Daten“
Daten - Buch „Daten über Daten“
Metadata / Marcia Lei Zeng and Jian Qin
Zeng, Marcia Lei *1956-*
Qin, Jian *1956-*
London : Facet, 2008
xvii, 365 p. : ill. ; 23cm
Includes bibliographical references and index
1-85604-655-9, 978-1-85604-655-8 (pbk)
Metadaten
STRUKTURIERTE
Metadaten-Schema
Titel
Verfasser
Sonstige beteil. Person
Erschienen:
Umfang
Anmerkung
ISBN
Schlagwörter
Seite 8
Metadata „are (structured) data about data“ (Eric Miller)
Metadatenformate
(maschinen-lesbar)
Bezeichner eines Merkmals
(Menschen-lesbar)
4000 Suchen mithilfe semantischer Metadaten (PICA3)
021A $a Suchen mithilfe semantischer Metadaten (PICA+)
331Suchen mithilfe semantischer Metadaten (MAB)
245 00 $a Suchen mithilfe semantischer Metadaten (MARC21)
<titleInfo><title>Suchen mithilfe semantischer Metadaten</title></titleInfo>
(MODS)
Grundsätzlich und pragmatisch
Seite 9
PPN:
Titel:
Verfasser:
Sonst. Personen:
Erschienen:
Umfang:
Anmerkung:
ISBN:
Schlagwörter:
Mehr zum Thema:
Zeng, Marcia LeiVerfasser:
Metadaten-Element
Metadatensatz
folgt Regeln (z.B. Nachname Komma Leerzeichen Vorname)
Element-Wert
571230652
Metadata / Marcia Lei Zeng and Jian Qin
Zeng, Marcia Lei *1956-*
Qin, Jian *1956-*
London : Facet, c2008
xvii, 365 p. : ill. ; 23cm
Includes bibliographical references and index
1-85604-655-9, 978-1-85604-655-8 (pbk) : £39.95
*Metadaten / *Metadata
Dewey-Dezimalklassifikation: 025.3
Metadata „are (structured) data about data“
Seite 10
Metadata is „[…] to aid in their identification, discovery,
assessment, and management of the described entities“
AUFGABEN von Metadaten (FRBR User Tasks)
1. Verlässliches FINDEN ermöglichen: Recherche nach vom Benutzer
festgelegten Kriterien.
2. IDENTIFIZIEREN: Unterscheiden, was verschieden ist, z.B. Unterscheidung
von zwei Texten oder Aufnahmen, die mit demselben Titel veröffentlicht
wurden.
3. AUSWÄHLEN: Zusammenführen, was zusammengehört, den
Benutzerbedürfnissen entsprechend : z.B. Auswahl eines Texts in einer
Sprache, die der Benutzer versteht
4. Zu Gewähltem ZUGANG ERHALTEN: z.B. Bestellung für eine Publikation
abgeben
FRBR: Functional Requirements for Bibliographic Records
Seite 11
Metadata is „[…] to aid in their identification, discovery,
assessment, and management of the described entities“
TYPEN von Metadaten
Deskriptive Metadaten : Beschreiben eine Ressource zum Zweck der Entdeckung,
der Identifikation, der Auswahl und des Zugangs
Strukturelle Metadaten: Beschreiben die interne Organisation einer Ressource.
Beschreiben, wie miteinander verbundene Objekte miteinander in Beziehung
stehen, z.B. wie Seiten geordnet werden müssen, damit ein Kapitel entsteht.
Administrative Metadaten: „meta-metadata“; Informationen, die helfen eine
Ressource zu verwalten:
Technische Metadaten: Enthalten Informationen über Format und Dateityp
Metadaten für das Rechtemanagement: Enthalten Informationen, die für die
Berechtigung des Zugriffs und Informationen über das geistige Eigentum dienen
Herkunfts-Metadaten (Provenienz-Metadaten): Metadaten über die Herkunft der
Ressource: Feststellung der Vertrauenswürdigkeit; Bewahrung der Nutzbarkeit
Seite 12
• Formale Beschreibung einer Ressource
• Strukturierte „Daten über Daten“
• Ein Metadatensatz besteht aus Metadaten-Elementen und den dazugehörigen
Werten
• Für eine Vielzahl an Dingen (Texte, Bilder, Objekte, Personen, etc.)
• Getrennt vom beschriebenen Objekt oder enthalten im Objekt
• menschen-lesbar, maschinen-lesbar (und maschinen-interpretierbar)
• Aufgaben von Metadaten sind die Unterstützung beim Finden, Identifizieren,
Auswählen einer Ressource, sowie Zugang zu ihr erhalten
• Es gibt verschiedene Typen von Metadaten: deskriptive, administrative,
technische Metadaten, Struktur- und Provenienz-Metadaten, Metadaten für das
Rechtemanagement
Seite 13
Zusammenfassung: Was sind Metadaten?
2. Metadatenstandards
Seite 14
Metadatenstandards
Standards?
"The nice thing about standards is that you have so many to
choose from. Furthermore, if you do not like any of them, you
can just wait for next year's model."
Quelle: Andrew Tanenbaum, Computer Networks, 2nd edn., p. 254
Ein Metadatenstandard
• sorgt für: Konsistenz der Metadaten
• verbessert: Metadatennutzung
• erlaubt: Austausch von Metadaten und die Verlinkung von
Objekten anwendungsübergreifend
Seite 15
Metadatenstandards
„A content metadata standard is defined as an open specification that itemizes a set
of elements and their meanings. Each element is tagged with an identifier (e.g.,
"Title", "Author") that distinguishes the element from other elements within the
standard. In addition, each element has a set of constraints or rules specifying the
allowable content of the element and its relationship to other elements within the
standard.“ (http://www.niso.org/publications/white_papers/crosswalk/ )
"A metadata schema provides a formal structure designed to identify the knowledge
structure of a given discipline and to link that structure to the information of the
discipline through the creation of an information system that will assist the
identification, discovery, and use of information within that discipline" . American
Library Association Committee on Cataloging: Description and Access (CC:DA) Task Force on
Metadata
Seite 16
Aufbau eines Metadaten-Standards am
Beispiel Dublin Core
Dublin Core Metadata Initiative (DCMI)
Zunächst für die Beschreibung von
Webressourcen
15 Kern-Elemente (“Core”): Title, Creator,
Subject, Description, Publisher,
Contributor, Date, Type, Format, Identifier,
Source, Language, Relation, Coverage,
and Rights
Alle optional und wiederholbar
Reihenfolge der Elemente beliebig
http://dublincore.org/documents/dces/
Title ”Metadata Demystified”
Creator ”Brand, Amy”
Creator ”Daly, Frank”
Creator ”Meyers, Barbara”
Subject ”metadata”
Description ”Presents an overview of
metadata conventions in publishing.”
Publisher ”NISO Press”
Publisher ”The Sheridan Press”
Date ”2003-07"
Type ”Text”
Format ”application/pdf”
Identifier ”http://www.niso.org/standards
/resources/Metadata_Demystified.pdf”
Language ”en”
Seite 17
Dublin Core Metadata Element Set
Dublin Core Simple: 15 Elemente:
 titel Titel
 creator Verfasser oder Urheber
 contributor Mitarbeiter
 publisher Verlag
 subject Thema des Inhalts (Sacherschließung)
 date Datum
 coverage Abdeckung
 description Beschreibung
 language Sprache
 type Art, Gattung
 format Format
 identifier Eindeutige Identifizierung
 relation Beziehung
 source Quelle
 rights Rechte
Seite 18
Dublin Core - Metadatenelemente
Element (property): Merkmal / Eigenschaft einer Ressource, wie Titel,
Autor etc.
„An Element is a property of a resource. As intended here, "properties" are
attributes of resources – characteristics that a resource may "have", such
as a Title, Publisher, or Subject.“ (DCMI Glossary)
Seite 19
Dublin Core Element Set - Übung
DC element value
title
creator
contributor
publisher
subject
date
coverage
DC element value
description
language
type
format
identifier
relation
rights
Sprache: rumänisch, englisch
Seite 20
Dublin Core Element Set - Übung: Lösung
Sprache: rumänisch, englisch
DC element value
title Intelectuali Români implicati în
dezvoltarea civilizatiei economice
title Romanian intellectuals inolved in
the development of the economic
civilization
creator Saizu, Ioan
contributor -----
publisher Ed. Acad. Romane
subject Wirtschaftsgeschichte
subject Rumänien
date 2003
coverage Rumänien
DC element value
description --------------
language rumänisch
language englisch
type Buch / Book
format 308 S.
identifier 973-270983-9
relation ---------------
rights ---------------
Seite 21
Dublin Core Metadata Terms
15 Elemente bieten wenig Differenzierung. Was tun?
 Dublin Core Metadata Terms
Element Refinement: Verfeinerung der Bedeutung eines Elements
Die Refinements können als Unterbegriff des Elements verstanden werden.
Beispiel: Element „Description“ mit den Refinements „Abstract“ oder „Table of
Contents“
55 Terms: http://dublincore.org/documents/dcmi-terms/
dc.description
Kann jegliche Art von Beschreibung enthalten
dcterms.abstract
Hier sind nur Abstracts zulässig
dcterms.tableOfContents
Hier sind nur Inhaltsverzeichnisse zulässig
Seite 22
Encoding Schemes
Weitere semantische und syntaktische Differenzierung bieten Encoding Schemes
Wie, in welcher Form wird das Element beschrieben?
Kodierungs-Schema, kontextabhängige Informationen oder Parsing-Regeln (Syntax-
Analyse-Regeln), die dazu beitragen, den Wert eines Elements zu interpretieren.
Semantics is about meaning; syntax is about form
Weibel, S. et.al. (2002)
Semantik: Semantik (von Altgriechisch σημαίνειν sēmaínein ‚bezeichnen‘, ‚zum Zeichen gehörig‘),
auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen.
Zeichen können in diesem Fall Wörter, Phrasen oder Symbole sein. Die Semantik beschäftigt sich
typischerweise mit den Beziehungen zwischen Zeichen und Bedeutungen dieser Zeichen.
[http://de.wikipedia.org/wiki/Semantik]
Syntax: die rein formalen Beziehungen zwischen (sprachlichen) Zeichen, z.B.
Datumsangabe: soll in der Syntax YYYY-MM-DD erfolgen.
Seite 23
Vocabulary Encoding Schemes
Vocabulary Encoding Scheme (VES):
Beschreibt, dass der Wert eine Bezeichnung aus einem kontrollierten
Wortschatz ist, z.B. Wert = Klasse (Notation) aus der DDC, Deskriptor aus
dem Standard Thesaurus Wirtschaft (STW), etc.
Bsp. Element „subject“ mit dem Encoding Scheme „DDC“
<dcterms:subject xsi:type „dcterms:DDC“>330</dcterms:subject>
Achtung! Jetzt
kommt ein Thema,
und zudem stammt
der Wert aus der
DDC
Seite 24
Vocabulary Encoding Schemes:
Klassifikationen – Thesauri – Schlagwörter und mehr
Klassifikationen
DDC Dewey Decimal Classification
UDC Universelle Dezimalklassifikation
BK Basisklassifikation
LCC Library of Congress Classification
RVK Regensburger Verbundklassifikation
JEL: Klassifikation des Journal of Economic Literature
Thesauri
STW Standard Thesaurus Wirtschaft
TGN Getty Thesaurus of Geographic Names
TheSoz Theaurus Sozialwissenschaften
IBLK Europäischer Thesaurus Internationale
Beziehungen und Länderkunde
MeSH Medical Subject Headings
AGROVOC Agrarwissenschaften, Forstwirtschaft,
Fischerei, Nahrungsmittel und verwandter Gebiete
INFODATA Thesaurus Informationswissenschaft
Normdateien (authority files)
GND Gemeinsame Normdatei (Personen,
Körperschaften , Schlagwörter)
LCSH Library of Congress Subject
Headings
Rameau Normdatei der BnF
VIAF Virtual International Authority File
Sonstiges kontrolliertes Vokabular
IMT Internet Media Type (auch MIME-
Type ) klassifiziert den Dateityp
z.B. für DC-Element „format“
DCMIType Vocabulary
Ressourcentype
z.B. für DC-Element „type“
Seite 25
Syntax Encoding Schemes
Syntax Encoding Scheme (SES):
Gibt an, wie die Zeichenketten, die bei der Beschreibung eines Objekts
verwendet werden, aufgebaut sein müssen und regelt damit die syntaktische
Struktur der Beschreibung, z.B. „JJJJ-MM-TT" als Standardausdruck eines
Datums.
Bsp. Element „Date“ mit Encoding Scheme „JJJJ-MM-TT“
<dcterms:date xsi:type dcterms:W3CDTF>2007-12-04</dcterms:date>
Achtung! Jetzt
kommt ein Datum
und außerdem hat
es das Format JJJJ-
MM-TT
Seite 26
Syntax Encoding Schemes
Normen und weitere Standards
ISO 8601 Data elements and interchange formats - Information interchange -
Representation of dates and times
W3C-DTF „defines a profile of ISO 8601, the International Standard for the
representation of dates and times „
DCMI Period Encoding Scheme (Zeiträume): „for identifying a single time interval using its limits „
DCMI BOX Encoding Scheme (geographische Räume): „method for identifying a region of space
using its geographic limits and representing that information as a value string.“
DCMI Point Encoding Scheme (geographischer Punkt): „a mechanism for indicating a point in
space using its geographic coordinates and representing that information as a
value string. „
URIs (Uniform Resource Identifier)
URL Uniform Resource Locator
URN Uniform Resource Name
Handle Handle
DOI Digital Objekt Identifier
PURL Persistent Uniform Resource Locator
Weitere Identifier
ISBN International Standard Book Number:
ISBN 978-3-7657-2781-8
ISSN International Standard Serial Number:
ISSN 4177-0815
BICI Book Item and Component Identifier
SICI Serial Item and Contribution Identifier
(ANSI/NISO standard Z39.56).
ISMN International Standard Music Number Seite 27
Syntax and Vocabulary Encoding Schemes
RFC 3066: Vorläufer der ISO-639
ISO 639 Sprachen (Sprachcodes):
ISO 639-1 (Alpha-2 Code)
ISO 639-2 (Alpha-3 Code)
ISO 639-3 (Alpha-3 Code for comprehensive coverage of
languages)
Semantisch im Hinblick auf das enthaltene Vokabular.
Syntaktisch im Hinblick auf die Kodierung in bestimmter Anzahl Zeichen 
automatisch prüfbar (Plausibilitätsprüfung).
http://upload.wikimedia.org/wikipe
dia/commons/thumb/9/95/ISO_63
9_Schematische_Darstellung.svg
/700px-
ISO_639_Schematische_Darstell
ung.svg.png
Seite 28
Metadaten-Standards und -Schemas definieren zulässige Elemente und ihre
Bedeutung (Semantik), sowie ihre Form (Syntax):
• Sachliche Definition des Inhalts (content rules). Diese besagen, wie die Werte
für das Datenelement ausgewählt und repräsentiert werden.
• Regeln über die Form des Feldinhalts (representation rules): z.B. Regeln
über die Groß- und Kleinschreibung
• Regeln über die Syntax des Inhalts, also wie der Inhalt codiert werden muss:
z.B. ein Datum muss immer in der Form YYYY-MM-TT eingegeben werden
(syntax encoding scheme)
• Regeln über die zulässig Inhalte (content values), z.B. der Inhalt des Feldes
muss aus einem kontrollierten Vokabular, wie z.B. dem STW, der DDC, der
UDC, der BK, etc. stammen (vocabulary encoding scheme)
• Angaben zur Wiederholbarkeit und Verpflichtung eines Elements
• Angaben wie verschiedene Elemente miteinander in Beziehung stehen
Zusammenfassung: Aufbau eines Metadatenstandards
Seite 29
Zusammenfassung: Aufbau von Dublin Core
• Dublin Core Metadata Element Set = 15 Elemente (Dublin Core Simple)
• Dublin Core Metadata Terms (Dublin Core Qualified)
• Element Refinements = 55 Elemente
• Encodings Schemes und Refinements sind „Qualifier“
• Dublin Core Qualifier: http://dublincore.org/documents/usageguide/qualifiers.shtml
• Dublin Core auf Deutsch: KIM - Kompetenzzentrum Interoperable Metadaten
Seite 30
Prinzipien von Dublin Core
One-to-One-Principle - Das 1:1-Prinzip:
Jede Beschreibung (decription) steht für ein und nur ein Objekt (Ressource), z.B.
eine Beschreibung für einen gedruckten Text, eine weitere für die elektronische
Ausgabe.
Dumb-Down-Principle – Prinzip der Vereinfachung:
Die Bedeutung eines Elements kann verfeinert, aber nicht erweitert werden.
Beispiel: Element „description“ mit den refinements „ToC“ oder „Abstract“ (dumb
down der Eigenschaft und des Wertes)
Appropriate Values – Angemessene / entsprechende Inhalte:
„Best Practice“ : menschen- und maschinelesbar.
Seite 31
Prinzipien von Dublin Core
1. Simplicity: Einfachheit der Beschreibung
2. Semantic interoperability: Semantische Interoperabilität
3. International consensus: Internationale Übereinkunft über Standard
4. Interdisziplinary: Interdisziplinär einsetzbar
5. Extensibility: Erweiterbarkeit, keine Beschränkung auf DC-Elemente
6. Modularity: Modular, im Baukasten-Prinzip verwendbar
7. Modifiability: Jedes Element kann durch die Angabe eines Attributs verändert werden
8. Optionality: keine Pflichtfelder
9. Repeatability: Alle Elemente können mehrmals in einem Datensatz auftreten
10. Independency: Unabhängigkeit von einer spezifischen Syntax
Seite 32
Metadatenformate
bibliographisch / deskriptiv
Metadatenstandard ist nicht gleich Metadatenformat
Dublin Core Metadatenstandard
• als .txt-Datei
• als .html- oder .xhtml-Datei
• als .xml-Datei
• als .rdf-Statements
Syntax Guidelines für die korrekte Konstruktion von DC-Datensätzen in diese
Formate: http://dublincore.org/specifications/
Grundsätzlich:
• Metadatenstandards als Text-Standard entwickelt
und nachträglich weitere Repräsentationen
• Originäre XML-Standards
• Proprietäre Formate, z.B. .mrc für MARC
 Metadatenformat, z.B. DC-DS-XML
Seite 33
Exkurs XML
 Extensible Markup Language = erweiterbare Auszeichnungs-
Sprache
 Beispiele für Auszeichnungssprachen: HTML (Hypertext Markup
Language), SGML (Standard Generalized Markup Language),
XML
 Standard zur Erstellung von maschinen- und
menschenlesbaren Dokumenten
 Der Standard wurde vom World Wide Web Consortium (W3C)
definiert
 Befehle in Form von semantischen tags:
<titel> </titel>, <date> </date>, <creator></creator>
<befehl>Information</befehl>
Seite 34
Unterschiede zwischen HTML und XML
Unterschied zu HTML
 Tags sind nicht festgelegt. Sie werden für
spezielle Anwendung definiert:
Datenbank 1: <autor>Marx, Karl<autor/>
Datenbank 2: <verfasser>Marx, Karl<verfasser/>
 HTML „Kann man sehen“ = Auszeichnung der
Strukturierung von Inhalten
 XML transportiert Semantik = logische
Auszeichnung der Inhalte
Gemeinsamkeiten
 Auszeichnungssprachen
 Stammen von SGML ab
 Befehle in Form von tags
 Textformat (im Sinne von
Nicht-binär)
<h1>Metadaten für Einsteiger</h1>
Jetzt kommt
eine
Überschrift:
20 pt., fett
Ende
Überschrift:
Absatz-
schriftart
HTML
<titel>Metadaten für Einsteiger</titel>
Hier kommt
der Titel der
Ressource
Hier endet
der Titel der
Ressource
XML
Präsentation
Bedeutung
Seite 35
XML - Eigenschaften
• Trennt strikt zwischen Daten und Verarbeitung der Daten: Welche Software für
die Verarbeitung verwendet wird, ist nicht festgelegt.
• XML = Textformat: erleichtert es Menschen die enthaltene Information zu verstehen
und macht unabhängig von bestimmten technischen Implementierungen
• Für hoch-strukturierte Daten (aus relationalen Datenbanken) und semi-
strukturierte Daten (von Menschen verfasste Texte)
• Einfach: leichter zu erlernen und leichter zu implementieren als Vorfahren (SGML)
.csv vs. .xml
Seite 36
XML - Eigenschaften
• Flexibel: da „tags“ (Bezeichner) in XML nicht festgelegt sind, kann jeder Betreiber
sein eigenes Format entsprechende seiner Bedürfnisse erstellen.
• Flexible vs. Interoperabel: DB1: <verfasser>, DB2: <autor>, aber identische
Semantik
• Metadatenformate ausgedrückt in XML:
100 1 $aSchultz, Theodore Paul,$0(DE-
601)060006277.
245 10 $aChanging world prices, women's
wages, and the fertility transition
:$bSweden, 1860 - 1910 /$cT. Paul
Schultz.
MARC21
MARC21 in XML
Seite 37
Metadatenstandards in XML
Metadata Object and Description Schema
• Originärer XML-Standard
• Entwickelt als Kompromiss zwischen dem komplexen MARC21 und dem
einfachen Dublin Core
• Für elektronische Ressourcen
• Entwickelt vom Network Development and MARC Standards Office der LoC
• Bildet Teile der MARC21-Elemente ab, bei Standard-Konvertierung
Informationsverlust
Seite 38
Machine-Readable Cataloging - MARC21
Internationales Austausch- und
Speicherformat
• für bibliographische Nachweise
in Bibliothekskatalogen
• Entwickelt von der LoC
• ANSI/NISO Z39.2
• Viele Dialekte
1000 Elemente mit Unterfeldern
und Indikatoren
• ca. 60 am häufigsten
verwendete
• Fixed Fields (00X)
Kat.-Regelwerk: AARC2
Format: .mrc / .marc
Tools: Marc-Editor „MarcEdit“
xxxxxnaa a22yyyyy c 4500
001 592906469
003 DE-601
005 20090728100724.0
008 090304s2008 000 0 eng d
016 7 $a7153508$2DE-600
040 $aGBVCP$bger$erakwb
041 0 $aeng
100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE-
588)133059545
245 10$aEscaping the unemployment trap :$bthe case of
East Germany /$cChristian Merkl; Dennis J. Snower
300 $bgraph. Darst.
650 7$81.1x$aLangzeitarbeitslosigkeit$0(DE-
601)091374367$0(DE-STW)18124-6$2stw
650 7$81.2x$aArbeitsproduktivität$0(DE-
601)091347742$0(DE-STW)10440-1$2stw
[…]
700 1 $aSnower, Dennis J.$eAuthor$4aut$0(DE-
601)366752960$0(DE-588)124825109
773 08$iIn: $tJournal of comparative
economics$dAmsterdam : Elsevier$gVol. 36, No. 4 (2008),
p. 542-556$q36:4<542-556$w(DE-601)130445541$x0147-5967
773 08$iIn:
900 $aGBV$bZBW Kiel <206>
952 $d36$j2008$e4$c12$h542-556
954 $a26$b923675930$c01$x0206
http://www.loc.gov/marc/
Seite 39
650 = Sachschlagwort
Indikator 1 = undefiniert
Indikator 2 = Quelle des Vokabular wird spezifiziert in Unterfeld 2
Unterfeld a = Deskriptor
Unterfeld 0 = Identifier der Ressource in der Datenbank „DE-601“ (GBV)
Unterfeld 2 = Deskriptor stammt aus dem STW
Unterfelder und Indikatoren
Seite 40
Project of Integrated Catalogue Automation - PICA
PICA+: Datenbank-Format
PICA3: Katalogisierungssicht
u.a. GBV, SWD, HEBIS, DNB
für bibliographische Nachweise in
Bibliothekskatalogen
ca. 1300 Informationseinheiten:
Elemente mit Unterfeldern
Verschiedene Satztypen, die
miteinander verknüpft sind
(Hierarchische Datensätze)
Kat.-Regelwerk: RAK (D)
001@ $026$aU
001A $00206:04-03-09
001B $00206:10-03-09$t10:42:23.000
001D $00206:04-03-09
001U $0utf8
001X $00
002@ $0Asu
003@ $0592906469
010@ $aeng
011@ $a2008
021A $aEscaping the unemployment trap$dthe case of
East Germany$hChristian Merkl; Dennis J. Snower
027D/00 $aJournal of comparative
economics$pAmsterdam$nElsevier$00147-5967$z7153508
028A $dChristian$aMerkl$9533312205$8Christian@Merkl ;
PND-ID: 133059545
028B/01 $dDennis J.$aSnower$9366752960$8Dennis
J.@Snower ; PND-ID: 124825109
031A $d36$j2008$e4$c12$h542-556
034M $agraph. Darst.
039B $cIn$9130445541$8Journal of comparative
economics. - Amsterdam : Elsevier$x200800000360004458
039B $cIn$7!562253327!
045D/00 $9091374367$8Langzeitarbeitslosigkeit
045D/00 $9091347742$8Arbeitsproduktivität
045D/00 $9091384966$8Qualifikation
045D/49 $b49
101B $004-03-09$t09:15:56.000
Seite 41
Pica3 - Pica+
Katalogisierungssicht Pica3
Datenbanksicht PICA+
Seite 42
43
Pica3 - Pica+
Steuerzeichen
in Pica3 sind
Unterfelder (subfields)
in Pica+
Subfield
Eine individuelle Informationseinheit in
einer strukturierten Datei.
Eine Untergliederung eines Feldes.
Beispiel: ein Feld für Titelangaben hat
mehrere Unterfelder: HST, Zusatz,
Verfasserangabe
Seite 43
Beispiele für Metadatenstandards
Metadatenstandards
1.für bibliographische Ressourcen: z.B. Pica+, MODS, DC
2.für den Datentausch: z.B. MAB 2, MARC21, ONIX
3.für Multimedia-Objekte: z.B. MIX (Bilder), MPEG-7/21 (Video)
4.für digitale Sammlungen: z.B. METS (Wrapper)
5.für sozialwiss. Forschungsdaten: z.B. DDI, SDMX
6.für Archive (Findbücher): z.B. EAD
7.für die Langzeitarchivierung: z.B. PREMIS
8.für die Strukturauszeichnung von Dokumenten: z.B. TEI
9.für Museumsobjekte: z.B. LIDO
Seite 44
Seeing Standards: A Visualization of the Metadata
Universe (Jenn Riley)
http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards.pdf Seite 45
DOKUMENTATION eines Metadaten-Standards
• „Uses and Features“
• „Usage Guidelines“
• „Implementation Guidelines“
• „Schemas and Outline“
• „Data Dictionary“
• “Specification”
• Encoding Guidelines
• Code Lists
• Beispiel-Datensätze
• Tutorials
• Mailinglisten und Foren
• Einsatzgebiet und –möglichkeiten
• Anwendungsregelwerk
• Aufzählung und genaue Definition
der Elemente
• Kodierungs-Regeln
• Kodierungs-Listen
• Beispiel-Datensätze
• Anleitungen mit Übungen
• Mailinglisten und Foren
Metadatenstandards kennenlernen
100 1 $aMerkl,
Christian$0(DE-
601)533312205$0
(DE-
588)133059545
Seite 46
• Metadatenstandards sorgen für die Konsistenz der Metadaten und verbessern
damit Nutzung und Austausch
• Ein Metadatenstandard ist aufgebaut aus Metadaten-Elementen (Eigenschaft /
Merkmal einer Ressource; property)
• Metadatenelemente werden definiert hinsichtlich ihrer Bedeutung (Semantik)
und hinsichtlich der Form (Syntax)
• Es gibt Vocabulary Encoding Schemes (Klassifikationen, Thesauri,
kontrolliertes Vokabular, Normdateien, Schlagwortlisten)
• und Syntax Encoding Schemes (Normen, URIs, weitere Identifier) zur
genaueren Definition von Metadatenelementen
• Zur Definition eines Elements gehört auch eine Aussage über die
Wiederholbarkeit und Verpflichtung eines Elements, sowie darüber, wie
einzelne Elemente miteinander in Beziehung stehen.
Seite 47
Zusammenfassung: Metadatenstandards
• Metadatenstandard ist nicht gleich Metadatenformat: ein Standard (z.B. Dublin
Core) kann in verschiedenen Formaten auftreten: z.B. DC-HTML, DC-XML,
DC-RDF
• XML eignet sich, weil es menschenlesbar und gleichzeigt maschinelesbar ist,
weil es gut für hoch-strukturierte Daten einsetzbar ist und weil es flexibel ist, da
die Tags nicht festgelegt sind.
• Einige Standards weisen spezielle strukturelle Besonderheiten auf: Subfields,
Indikatoren, externe und interne Sichten.
• Es gibt eine Vielzahl von Standards je nach Einsatzzweck und/oder Typ der
Ressource
• Wenn man Standards kennenlernen möchte, bedient man sich der Standard-
Dokumentationen
Seite 48
Zusammenfassung: Metadatenstandards
3. Application Profile
Seite 49
PPN
Titel
Verfasser Sonst. Beteil.Person
Umfang
ISBN
Schlagwörter
Fussnoten
Verwandte Ressourcen
URL
Metadaten-Standard einer „Community“ / Domain,
z.B. PICA, Dublin Core, DDI etc.
DOI
Tongeschlecht
Epoche
Bildformat
Anzahl Pixel
Primärkörperschaft
Format
URN
Kompression
Handle
Regie
Metadatenstandard und Metadatenschema
Metadatenformat
/-Schema einer
bestimmten
Anwendung, z.B.
Repository für
Publikationen
Metadaten-
Elemente
einer realen
Informations
-einheit
Titel:
Verfasser:
Sonst. Personen:
Körperschaft:
Erschienen:
Umfang:
Anmerkung:
ISBN:
Schlagwörter:
URL:
Seite 50
Metadaten-Dokumentation für individuelle Anwendungen:
Application Profiles
“In DCMI usage, an application profile is a declaration of the metadata terms an organization,
information resource, application, or user community uses in its metadata. In a broader sense, it
includes the set of metadata elements, policies, and guidelines defined for a particular application or
implementation. […] An application profile is not considered complete without documentation that
defines the policies and best practices appropriate to the application.” (DCMI Glossary)
Application Profile (AP): Metadaten-Profil, -schema einer bestimmten Anwendung,
das Elemente aus einem oder mehreren Standards enthält
Festlegung der
• Elemente
• Unterfelder/Refinements
• Encoding Schemes
• Wiederholbarkeit
• Pflichtfelder
Dokumentation der
• Struktur
• Richtlinien
• Best Practice
http://www.dlib.org/dlib/june06/chan/06chan.html
Seite 51
AP - Grundsätzliche Überlegungen
Welchen Zweck hat die Anwendung?
• Verwaltung von Daten für den
“Hausgebrauch”?
• Organisations-übergreifender
Datenaustausch?
• Integration der Daten in
Webdienste?
• …
Welche Funktionen soll die
Anwendung unterstützten?
• Erweiterte Suche?
• Browsing?
• Facetten?
• …
Was für Objekte werden beschrieben?
• Text, Personen, Filme …?
• …
Welche Beziehungen gibt es zwischen
den Objekten?
• Ist Urheber von …
• Ist Teil von …
• …
Was brauche ich, um meine Ziele und
Anforderungen umzusetzen?
• Welche Metadatenterme?
• Was für Encoding Schemas?
• Was für Einschränkungen?
Seite 52
Praxis – Kriterien für die Formatauswahl
Erst prüfen
• Gibt es für meine Anwendung
bereits einen Standard?
• Welcher Standard wird in meiner
Community genutzt?
• Welcher Standard passt zu meiner
Anwendung / in meinem Kontext?
• Welcher Standard entspricht am
ehesten meinen Anforderungen?
– “Use elements and qualifiers to meet the needs of your local context, but ...
– remember that your metadata may be interpreted by machines and people, so ...
– consider whether the values you use will aid discovery outside your local context.“
Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)
Seite 53Metadata Madness wheel, Musebrarian, http://www.flickr.com/photos/musebrarian/3289649684/
Praxis – Kriterien für die Auswahl des/der Standard(s)
– “Use elements and qualifiers to meet the needs of your local context, but ...
– remember that your metadata may be interpreted by machines and people, so ...
– consider whether the values you use will aid discovery outside your local context.“
Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)
Daran denken
• Auswahlkriterien: Anforderungen und Nachnutzbarkeit der Anwendung
• Dokumentation ist wichtig
• Verletze niemals die semantischen Grenzen eines Standards
Ja! zur semantischen Verfeinerung
Nein! zur semantischen Erweiterung
Seite 54
dcterms.creator
Application Profile - Namensräume
 DCMI namespace: "a collection of DCMI terms URIs“ (DCMI term URI: "The
URI that identifies a term..“)
„The purpose of an application profile is to adapt or combine existing schemas into
a package that is tailored to the functional requirements of a particular application,
while retaining interoperability with the original base schemas.“ Weibel, S. et.al. (2002)
55
dc.creator
Seite 55
Application Profile - Namensräume
 Namensräume: können für spezifische Anwendungen definiert werden
 Die Deklaration von Namensräumen erlaubt Designern von Metadaten-Schemas den
Kontext, in dem ein bestimmtes Element verwendet wird, genau zu benennen und
sichert zu, dass dieses Element im Namensraum eindeutig ist.
dc
dc.titel
dc.creator
dc.subject
dc.description
dcterms
dcterms.dateIssued
dcterms.abstract
dcterms.coverage
dcterms.spatial
vascoda
vap.placeOfPublication
vap.edition
vap.thematic
vap.ddc
meinAP
dc.titel
dc.creator
dc.Subject
dcterms.dateIssued
dcterms.abstract
dcterms.coverage
vap.placeOfPublication
vap.edition
vap.thematic
vap.ddc
Namensräume
Namespace Policy for the Dublin Core Metadata Initiative (DCMI)
http://www.dublincore.org/documents/dcmi-namespace/
Seite 56
Application-Profile - Singapore Framework
„...a framework for designing metadata applications for maximum interoperability
and for documenting such applications for maximum reusability.“
(http://dublincore.org/architecturewiki/SingaporeFramework/)
• Das Singapore Framework für Dublin-Core-Anwendungsprofile nennt die
Rahmenbedingungen um Metadatenanwendungen möglichst interoperabel zu
gestalten und so zu dokumentieren, dass sie nachnutzbar sind.
• Es definiert die Komponenten, die erforderlich und hilfreich sind, um ein
Anwendungsprofil (Application Profile) zu dokumentieren.
• Das Singapore Framework ist die Grundlage für die Beurteilung von
Anwendungsprofilen in Hinblick auf Vollständigkeit der Dokumentation und auf
Übereinstimmung mit den Prinzipien der Web-Architektur.
Seite 57
Application Profiles - Singapore Framework
http://www.dublincore.org/documents/singapore-framework/
http://www.kim-forum.org/Subsites/kim/SharedDocs/Downloads/DE/Uebersetzungen/singaporeFramework.pdf?__blob=publicationFile (deutsch)
• Funktionale Anforderungen
(verpflichtend)
• Domain-Modell
(verpflichtend)
• Beschreibungssatz-Profil
(verpflichtend)
• Nutzungsrichtlinien
(fakultativ)
• Richtlinien für die
syntaktische Kodierung
(fakultativ)
Seite 58
Zusammenfassung: Application Profile
• Metadatenschemas, bzw. -profile bestehen aus Elementen aus einem oder
mehreren Metadatenstandards
• Ein Applikation Profile ist die Festlegung der einsetzbaren Elemente und deren
Bedingungen (Encoding Schemes, Wiederholbarkeit, Verpflichtung, etc.) sowie
der zu nutzenden Richtlinien.
• Grundsätzliche Überlegungen: Zweck der Anwendung, Funktionen der
Anwendung, beschriebene Objekte und Beziehungen zwischen Ihnen.
• Man sollte eingeführte Standards nachnutzen und kann auch mehrere
Standards kombinieren.
• Um Elemente aus verschiedenen Standards eindeutig benennen zu können
werden Namenräume (namespaces) verwendet.
• Eine Handreichung zur Erstellung optimaler Application Profiles bietet das
Singapore Framework der DCMI.
Seite 59
Application Profile
„The main goal of application profiles is to increase the
"semantic interoperability" of the resulting metadata
instances within a community of practice, by going
beyond the universal consensus of a single standard,
without compromising the basic interoperability that
the standard enables across the boundaries of these
communities.“
[Special section on semantic interoperability in global information systems,
ACM SIGMOD Record, Vol. 28, No. 1, March 1999.]
Seite 60
Interoperabilität
Interoperabilität ist die Fähigkeit unterschiedlicher Informationssysteme
miteinander zu kommunizieren und so Metadaten möglichst effizient und sinnvoll
und mit einem minimalen Verlust an Information auszutauschen.
 systemübergreifender Austausch von Metadaten unter möglichst geringem
Aufwand.
Problem:
Austausch oder Integration von Daten, die in
verschiedenen Standards vorliegen
Seite 61
62
Interoperabilität
Strukturelle Interoperabilität
• gegeben, wenn unterschiedlichen
Metadatenschemas ein gemeinsa-
mes Datenmodell zugrunde liegt
(z. B. DCMI Abstract Model, FRBR).
Syntaktische Interoperabilität
• gegeben, wenn unterschiedliche
Metadaten-Schemas in einer
gemeinsamen Kodierungssyntax
(z. B. XML, RDF) wiedergegeben
werden.
Semantische Interoperabilität
• gegeben, wenn unterschiedliche
Metadatenschemas ein
gemeinsames Vokabular
(Metadatenstandard) verwenden
Seite 62
Interoperabilität - Übung
001@ $026$aU
001A $00206:04-03-09
001B $00206:10-03-09$t10:42:23.000
001D $00206:04-03-09
001U $0utf8
001X $00
002@ $0Asu
003@ $0592906469
010@ $aeng
011@ $a2008
021A $aEscaping the unemployment trap$dthe case of
East Germany$hChristian Merkl; Dennis J. Snower
027D/00 $aJournal of comparative
economics$pAmsterdam$nElsevier$00147-5967$z7153508
028A $dChristian$aMerkl$9533312205$8Christian@Merkl
; PND-ID: 133059545
028B/01 $dDennis J.$aSnower$9366752960$8Dennis
J.@Snower ; PND-ID: 124825109
031A $d36$j2008$e4$c12$h542-556
034M $agraph. Darst.
039B $cIn$9130445541$8Journal of comparative
economics. - Amsterdam :
Elsevier$x200800000360004458
039B $cIn$7!562253327!
045D/00 $9091374367$8Langzeitarbeitslosigkeit
045D/49 $b49
101B $004-03-09$t09:15:56.000
Pica+
MODS
Seite 63
Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht
interoperabel?
Interoperabilität - Lösung
001@ $026$aU
001A $00206:04-03-09
001B $00206:10-03-09$t10:42:23.000
001D $00206:04-03-09
001U $0utf8
001X $00
002@ $0Asu
003@ $0592906469
010@ $aeng
011@ $a2008
021A $aEscaping the unemployment trap$dthe case of
East Germany$hChristian Merkl; Dennis J. Snower
027D/00 $aJournal of comparative
economics$pAmsterdam$nElsevier$00147-5967$z7153508
028A $dChristian$aMerkl$9533312205$8Christian@Merkl
; PND-ID: 133059545
028B/01 $dDennis J.$aSnower$9366752960$8Dennis
J.@Snower ; PND-ID: 124825109
031A $d36$j2008$e4$c12$h542-556
034M $agraph. Darst.
039B $cIn$9130445541$8Journal of comparative
economics. - Amsterdam :
Elsevier$x200800000360004458
039B $cIn$7!562253327!
045D/00 $9091374367$8Langzeitarbeitslosigkeit
045D/49 $b49
101B $004-03-09$t09:15:56.000
Pica+ (text)
MODS (xml)
Seite 64
Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht
interoperabel?
4. Mapping
Seite 65
Was bedeutet „Mapping“?
Aufgabe: Integration heterogener Metadaten in einem System: EconBiz
Dublin Core (XML)
PICA 3
Titel=4000
Titel=<title>
• Metadaten verschiedener
Provenienz, die in verschiedenen
Formaten vorliegen
• Mittels Suchmaschine-Technologie
unter einer Oberfläche durchsuchen
• Verfeinerung per Drill-Down
Seite 66
• „Übersetzen“ der Elemente und Regeln von einem Standard (Schema /
Format) in einen anderen
• Mapping: die sich entsprechenden Bestandteile zweier unterschiedlicher
Metadaten-Standards oder -schemata miteinander in Beziehung setzen samt
Regeln
• Metadata "mapping" refers to a formal identification of equivalent or nearly
equivalent metadata elements or groups of metadata elements from different
metadata schemas, carried out in order to facilitate semantic interoperability
(Getty Glossary)
Element DB2 – MAB (Ziel) DB1 – PICA (Quelle) Anmerkungen
Bezeichner Syntax Bezeichner Syntax Anweisung für Transformation
Verfasser 100 Nachname, Vorname 3000 Vorname@Nachname
Quell-Wert vor Klammeraffen in Zielformat mit
Komma Leerzeichen hinter Quell-Wert nach
Klammeraffen schreiben, […]
[…]
Seite 67
Was bedeutet „Mapping“?
Seite 68
Crosswalk
“A table that maps the relationships and equivalencies
between two or more metadata schemes. Crosswalks
or metadata mapping support the ability of search
engines to search effectively across heterogeneous
databases”. http://dublincore.org/documents/usageguide/glossary.shtml#C
Crosswalk
A crosswalk ist "a mapping of the elements,
semantics, and syntax from one metadata scheme
to those of another„.
(http://www.niso.org/publications/press/Understandin
gMetadata.pdf ).
Crosswalks sind laterale Mappings, d.h. sie sind
Einbahnstrassen von einem Schema in das andere.
Seite 69
Einige Problemfelder beim Mappen:
• Mapping zwischen zwei unterschiedlich mächtigen Standards / Schemas:
fehlende Felder im Zielformat / mehr als ein Feld im Zielformat
• Unterschiedliche Eigenschaften: Einige Felder können als obligatorisch
(Pflichtfeld) und andere als optional deklariert werden. Das wiederholte
Vorkommen eines Elements kann zulässig sein oder nicht (Wiederholfähigkeit).
• Unterschiedliche Syntax der Felder (unterschiedliche syntax encoding
schemes): (z.B. A: „Vorname“, „Nachname“ und B: „Name“ (Nachname,
Vorname) und C: „Vorname@Nachname“)
• Verschiedene terminologische Vokabulare (unterschiedliche vocabulary
encoding schemes): Werden unterschiedliche Vokabulare (z.B. Klassifikationen)
verwendet müssen, diese ebenfalls „übersetzt“ werden (Cross-Konkordanz).
Mapping in der Praxis - Problemfelder
Seite 70
Mapping in der Praxis
In welcher Beziehung stehen die zu mappenden Elemente zueinander?
Grad der strukturellen Übereinstimmung:
• 1:1 one-to-one
• 1:n one-to-many
• n:1 many-to-one
• 1:0 one-to-none
Grad der semantischen Übereinstimmung:
• = äquivalent
• > Oberbegriff
• < Unterbegriff
• ≈
Seite 71
Mapping in der Praxis
=
"is the same as„
Semantik des Quell- und des Zielformats stimmen überein.
 Einfaches Element-to-Element-Mapping (Aber: Encoding Scheme beachten!)
<dcterms:abstract> DC-Definition: A summary of the resource
<mods:abstract> MODS-Def.: a summary of the content of the resource
Quelle Ziel
Seite 72
<dc:language>Deutsch</dc:language> <mods:languageTerm type= "code" authority="iso639-2b">
ger</mods:languageTerm>
<
Quell-Element ist „Unterbegriff“ des Zielelements
Semantik des Quellelements ist enger gefasst, als die des möglichen Zielelements.
Quelle Ziel
<mods:relatedItem type=„isReferencedBy>
</relatedItem>
<dc:relation></dc:relation> DC-Definition: A related resource.
MODS-Definition: Citations or references
to published bibliographic descriptions,
reviews, abstracts, or indexes of the
content of the resource
Mapping in der Praxis
Seite 73
Mapping in der Praxis
>
Quell-Element ist „Oberbegriff“ von Ziel-Element
Semantik des Quellelements ist breiter gefasst, als die des Zielelements.
<dc:subject> DC-Def.: „The topic of the resource.“ (nicht eingeschränkt;
Geographika, Sachschlagwörter, Zeitschlagwörter etc.)
<mods:subject> MODS-Def: "topic" is used as the tag for any topical subjects
<mods:topic> that are not appropriate in the <geographic>, <temporal>,
<titleInfo>, or <name> subelements
 nicht zulässig!
Quelle Ziel
Seite 74
Mapping in der Praxis
Quellformat: MIX
<Compression>
<CompressionScheme>1</CompressionScheme>
<CompressionLevel>10</CompressionLevel>
</Compression>
Zielformat: Dublin Core:
?
nicht möglich
Informationsverlust!
http://commons.wikimedia.org/wiki/File:Rotten_apple.jpg
Seite 75
1:0
Im Zielstandard gibt es kein Feld, das mit der Semantik des Quellelements
übereinstimmt.
Mapping in der Praxis
1:n
Quell-Element muss auf zwei oder mehrere Ziel-Elemente verteilt werden /
Nur Teil eines Quellelements kann auf Ziel-Element gemappt werden
<gils:ContactName> The name of the person acting as contact for the
information resource.
<name type="personal">
<namePart type="given"></namePart>
<namePart type="family"></namePart>
</name>
Transformationsregel angeben: anhand Syntax der
Werte nach möglichen Trennzeichen (Steuerzeichen)
suchen
http://commons.wikimedia.org/wiki/File:Apfelteiler_fcm.jpg
Seite 76
n:1 Mehrere Quell-Elemente entsprechen Ziel-Element
Nur zwei oder mehr verschiedene Informationen gemeinsam ergeben die Zielsemantik
Mapping in der Praxis
<part>
<detail type="volume">
<number>24</number> Band
</detail>
<detail type="issue"> Heft
<number>2</number>
</detail>
<extent unit="page"> Seitenangabe
<start>23</start>
<end>45</end>
</extent>
</part>
<dc:bibliographicCitation> Definition: A bibliographic reference for the resource.
Comment: Recommended practice is to include sufficient bibliographic
detail to identify the resource as unambiguously as possible.
Seite 77
 Regel mit welchen Steuerzeichen die
einzelnen Werte im Ziel-Element zusammen-
gesetzt werden sollen
http://commons.wikimedia.org/wiki/File:Fruit_salad_%281%29.jpg
Mapping in der Praxis
Wiederholbarkeit
Quell-Element ist wiederholbar, Ziel-Element nicht
Alle Werte des Quell-Elements in Ziel-Element mappen. Dabei Trennzeichen als
Regel angeben
Seite 78
Quell-Element ist nicht wiederholbar, Ziel-Element ist wiederholbar
 Trennzeichen im Quell-Elements als Steuerzeichen für Zerlegung des
Feldwerts nutzen
dc:subject: Begriff1
dc:subject: Begriff2
dc:subject: Begriff3
<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme>
Regel: alle Begriffe aus dc:subject in <ex:theme>
mit Leerzeichen Semikolon Leerzeichen getrennt
<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> dc:subject: Begriff1
dc:subject: Begriff2
dc:subject: Begriff3
Regel: Trenne die Begriffe in <ex:theme> anhand
Steuerzeichen (Leerzeichen Semikolon Leerzeichen)
Mapping in der Praxis
Verpflichtung
Quell-Element ist Pflichtfeld, Ziel-Element nicht
 Kein Problem
Quell-Element ist nicht verpflichtend; Zielelement ist Pflichtfeld
 Versuchen passende Werte aus einer Kombination von Quell-
Elementen zu generieren. Wenn nicht möglich , Mapping nicht
möglich.
Seite 79
Mapping in der Praxis
Probleme mit den Daten:
1. Missing data: Werte sind nicht vorhanden
2. Incorrect data: Werte entsprechen nicht den Konventionen
3. Confusing data: unzulässige / fehlende Trennzeichen, eingebettete HTML-Tags
4. Insufficient data: fehlende Angabe welches kontrollierte Vokabular, Format etc.
verwendet wird.
Iterativer
Prozess
Daten-
analyse
Mapping
Konver-
tierung
Kontrolle
Seite 80
Zusammenfassung: Mapping und Crosswalks
• Beim Mappen wird semantische, syntaktische und strukturelle
Interoperabilität hergestellt.
• Voraussetzung für ein korrektes Mapping ist die klare und präzise Definition
der Elemente in den jeweiligen Standards.
• Das Mapping sollte das Erstellen von Transformationsregeln ermöglichen,
mit denen sich die Daten aus dem einen Schema möglichst vollständig in das
andere Schema überführen lassen.
• Eigentliches Konvertieren der Daten mittels programmiertem Script
• Mapping ist der erste Schritt zur Integration heterogener Daten in einem
System
Seite 81
Mapping - Übung
Seite 82
Quelle: MODS-Schema:
Element language mit
encoding scheme
Soll nach PICA (GBV) gemappt
werden!
Aus der GBV-
Katalogisierungsrichtlinie:
<language>
<languageTerm type="code" authority="iso639-1">
de
</languageTerm>
</language>
Die Kategorie 1500 enthält Angaben zur Sprache des
vorliegenden Textes in codierter Form. Die Codierungen
erfolgen nach ISO 639-2, vgl. Anhang 2. Bei Neuaufnahmen
im System ist die Angabe der Sprachbezeichnung verbindlich.
Fragen:
Was muss man beim Mapping beachten? Ist ein Mapping möglich?
Mapping - Lösung
Seite 83
Antwort:
Ja, ein Mapping ist möglich: die Semantik der Felder in den beiden
Schemas stimmen überein.
Aber: das Vokabular muss „übersetzt“ werden. Anhand einer
Konkordanz zwischen ISO 639-1 und ISO 639-2 müssen die Werte
konvertiert werden.
de  ger
Zusammenfassung: Mapping und Crosswalks
Seite 84
“A crosswalk is a specification for mapping one
metadata standard to another. Crosswalks provide
the ability to make the contents of elements
defined in one metadata standard available to
communities using related metadata standards.
Unfortunately, the specification of a crosswalk is a difficult and error-prone task
requiring in-depth knowledge and specialized expertise in the associated metadata
standards. Obtaining the expertise to develop a crosswalk is particularly
problematic because the metadata standards themselves are often developed
independently, and specified differently using specialized terminology, methods
and processes. Furthermore, maintaining the crosswalk as the metadata standards
change becomes even more problematic due to the need to sustain a historical
perspective and ongoing expertise in the associated standards.”
http://www.niso.org/publications/white_papers/crosswalk/
5. Schnittstellen
Seite 85
Schnittstellen
Softwareschnittstellen / softwareseitige Datenschnittstellen :
• definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und
Komponenten ausgetauscht werden
• Z39.50:
• Netzwerkprotokoll, das
• im Bibliothekswesen Standard zur Abfrage von bibliographischen
Informationssystemen
• Mit dem Zusammenführen der Daten hat die Bedeutung der Abfrage von
verteilten Informationssystemen mit Z39.50 abgenommen
• SRU:
• Nachfolger von Z39.50
• HTTP-basierte Protokoll Search/Retrieve via URL (SRU/SRW),
• Techniken basieren auf etablierten Internet-Standards wie URI und XML
Seite 86
87
Linkresolver
• System zur Verfügbarkeitsanzeige wissenschaftlicher Publikationen.
• HTTP-basierter Service
• Metadaten der Quelle (Source) + gespeicherte Informationen über lokale Bestände
und Lizenzen
• Links auf "passende" Dienste wie elektronische Volltexte, Dokumentenlieferdienste,
den lokalen OPAC und den Buchhandel
Link-Resolver
http://www3.interscience.wiley.com/resolve/openurl?
genre=article
&issn=0022-2380
&volume=30
&issue=6
&spage=1017
OpenURL
Seite 87
openURL
„The OpenURL is a protocol for interoperability between an information resource
and a service component that offers localized services in an open linking
environment. It is in effect an actionable URL that transports metadata or keys to
access metadata for the object for which the OpenURL is provided. „
(http://www.oclc.org/research/projects/openurl/default.htm)
• Standard ANSI/NISO Z39.88
• ANSI/NISO Z39.88 - The OpenURL Framework for Context-Sensitive Services
• Pflege und Entwicklung OCLC
• Key-Encoded Value Guidelines:
http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html
Seite 88
openURL
Standard für die Übermittlung von bibliographischen Metadaten
(Context-Sensitive Linking)
http://openurlgw.hbz-nrw.de/gw
?aulast=Clark
&aufirst=Timothy
&au=Wright%2C+Mike
&atitle=So%2C+Farewell+Then+.+.+.+Reflections+on+Editing+the+Journal+of+M
anagement+Studies
&jtitle=Journal+of+management+studies+%3A+JMS
&stitle=J.+Manage.+Stud.+(GB)
&date=2009
&volume=46
&issue=1
&pages=1-9
&issn=00222380
&coden=JMASB2
&genre=article
Seite 89
OAI-PMH - OAI Protocol for Metadata Harvesting
Open Archives Initiative (OAI):
• Initiative von Betreibern von Dokumentenservern, um die abgelegten
elektronischen Publikationen besser auffindbar und nutzbar zu machen
• OAI Protocol for Metadata Harvesting (OAI-PMH) zum Einsammeln
(Harversting) und Weiterverarbeiten von Metadaten
• Metadaten werden von Data Providern bereitgestellt
• Geharvestete Datensätze werden von Service Providern aufbereitet und
bereitgestellt
• kleinster gemeinsamer Nenner: Dublin-Core-Datenmodell
• Erweiterung mit zusätzlichen Standards (z.B. MODS, MARC mittels MARCXML)
empfohlen
• http://www.openarchives.org/pmh/
Seite 90
OAI-PMH - OAI Protocol for Metadata Harvesting
OAI-Anfrage an EconStor
http://www.econstor.eu/dspace-oai/request?
verb=GetRecord&metadataPrefix=didl&identifier=oai:econstor.eu:10419/41393
Seite 91
92
OAI-PMH - OAI Protocol for Metadata Harvesting
http://www.econstor.eu/dspace-oai/request?
verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:econstor.eu:10419/41393
Seite 92
93
OAI-PMH - OAI Protocol for Metadata Harvesting
6 verbs um ein Repository abzufragen:
• GetRecord: individuellen Datensatz abfragen
• Identify: Information über Repository
abfragen
• ListRecords: um Datensätze zu harvesten
• ListIdentifiers: Abkürzung von
ListRecords: man bekommt nur header;
nicht Datensätze
• ListMetadataFormats: die zur Verfügung
stehen Metadatenformate abfragen
• ListSets: Kollektionen eines Repositorys
abfragen
Seite 93
OAI-Explorer
Schnittstelle um
Repositories
interaktiv auf ihre
Übereinstimmung
mit dem OAI-
PMH zu testen.
http://re.cs.uct.ac.za/
Seite 94
Schnittstellen für
Literaturverwaltung
Seite 95
COinS (ContextObjects in Spans)
• Methode zur Einbindung von bibliographischen Metadaten in HTML-Seiten
• Basiert auf OpenURL
• Browser-Plugins / weitere Programme können aus den „unsichtbaren“ COinS im
Quelltext einer Webseite
• OpenURL-Links für einen Linkresolver erzeugen
• Metadaten auslesen (Literaturverwaltung)
• Prinzip: Mikroformat
Schnittstellen für Literaturverwaltung
Seite 96
Zusammenfassung: Schnittstellen
Seite 97
• Schnittstellen definieren, wie Kommandos und Daten zwischen verschiedenen
Prozessen und Komponenten ausgetauscht werden
• Ein Linkresolver ist eine "Allround-Schnittstelle" zur Anzeige von Verfügbarkeits-
informationen.
• OpenURL nutzt für jedes Dokument einen abstrakten Namen, der durch einen
Mechanismus zu einer URL aufgelöst wird (Actionable URL)
• Key-Encoded-Values: einem Schlüssel (Element) wird ein Wert zugeordnet
• OAI-PMH: OAI Protocol for Metadata Harvesting: Schnittstelle zum Harvesten
von Metadaten von Dokumentenservern
• Dublin-Core-Datenmodell
• häufig zusätzliche Standards
• Metadaten für die Literaturverwaltung:
• RIS, BibTeX, EndNote, Mikroformat COinS
6. Metadaten für das Semantic Web
Seite 98
Metadaten für das Semantic Web
Problem heutiger Suchmaschinen
1. Unpassende Suchergebnisse
 Suchanfrage ist mehrdeutig
(Homonymie / Polysemie)
2. Fehlende Suchergebnisse
 Synonyme werden bei Suche nicht
berücksichtigt
z.B. Suche nach „Zukunftsforschung“ findet nicht
„Futorologie“, „future studies“
Ursache
• Mangel an expliziter Semantik
Seite 99
100
Mikroformate: semantische Annotation
• Formate zur »Feinstrukturierung« von Webseiten.
• (X)HTML-Dokumente menschen- und maschinenlesbar mit Infos ergänzt
• Mikroformate nutzen vorhandene XHTML-Attribute
• Informationen lassen sich aus einer Website extrahieren und anderen
Programmen zugänglich machen
• Domain-spezifische Vokabulare: Termine, Kontaktinformationen, soziale
Beziehungen.
• http://microformats.org/
Seite 100
BEGIN:VCALENDAR
VERSION:2.0
PRODID:http://www.example.com/calendarapplication/
METHOD:PUBLISH
BEGIN:VEVENT
UID:461092315540@example.com
ORGANIZER;CN="Alice Balder, Example
Inc.":MAILTO:alice@example.com
LOCATION:Somewhere
SUMMARY:Eine Kurzinfo
DESCRIPTION:Beschreibung des Termines
CLASS:PUBLIC
DTSTART:20060910T220000Z
DTEND:20060919T215900Z
DTSTAMP:20060812T125900Z
END:VEVENT
END:VCALENDAR
• Microdata erweiterte Microformats und überwindet deren Schwächen (z.B. unflexibel)
• Ausdruckstärkere semantische Annotation von Webseiten
• Specification: http://www.w3.org/TR/microdata/
• Attributerweiterung für HTML5: itemprop, itemref, itemtype,
itemscope, ..
Microdata: Schema.org
Seite 101
• 2011: Initiative der
Suchmaschinenbetreiber
Google, Bing, Yahoo,
Yandex: schema.org
• “create and support a
common set of schemas
for structured data
markup on web pages.”
• Nutzen für Fachportal
EconBiz: Verbesserte
Verbreitung der Meta-
daten
Microdata: Schema.org
Seite 102
Google Structured Data Testing Tool: http://www.google.com/webmasters/tools/richsnippets
Semantic Web
Tim Berners Lee (1998): Semantic Web Roadmap:
“The web was designed as an information space, with the goal
that it should be useful not only for human-human communication,
but also that machines would be able to participate and help.”
http://www.w3.org/DesignIssues/Semantic.html
 Nur möglich, wenn die Information von Maschinen gelesen und
interpretiert werden kann
Heute:
• Versuch die Bedeutung einer Information zu extrahieren
• Fehleranfällig
Semantic Web:
• Web Content in natürlicher Sprache wird explizit mit
semantischen Metadaten ausgezeichnet
• Semantische Metadaten kodieren die Bedeutung des Inhalts in
maschinen-interpretierbarer Art
Seite 103
Tim Berners-Lee at Campus Party Brasil, 2009,
http://commons.wikimedia.org/wiki/File%3ATim_Berners-Lee_CP.jpg
Semantic Web
Erweiterung des World Wide Web:
Seite 104
„Im Web werden immer mehr veröffentlichte Daten in RDF (s.u.) vorliegen, d.h. sie
folgen denselben Standards und können daher frei miteinander kombiniert und
verlinkt werden. So entsteht das Semantic Web als eine verteilte Datenbank, die
komplexe Abfragen und Schlussfolgerungen über dezentral vorliegende Daten
ermöglicht.“
Linked Data und die Bibliothekswelt
Adrian Pohl (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen)
http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf
 formale Sprache für die Bereitstellung von Metadaten im WWW
 Umgesetzt werden diese Beschreibungen nach dem RDF-Modell entweder als
Graph oder nach der RDF-Syntax als XML.
 Eine Ressource (z.B. eine Monographie) wird durch eine bestimmte Eigenschaft
(property) bzw. Relation beschrieben. Diese Eigenschaft kann einen bestimmten
Wert annehmen.
Das Kapital „Marx, Karl“
hatAutor
Ressource Eigenschaft Wert
RDF - Resource Description Framework
Subjekt Prädikat Objekt
http://d-nb.info/gnd/4099309-7 dc.creator „Marx, Karl“
http://d-nb.info/gnd/4099309-7 dc.creator http://d-nb.info/gnd/118578537
 Subjekt muss URI (Uniform Resource Identifier) sein, Objekt kann eine weitere
URI oder ein String (Zeichenkette) sein
Seite 105
Tripel
Ressource - URI - Repräsentation
Seite 106
Repräsentation: Webseite über
St. Michaelis
http://dbpedia.org/resource/
St._Michaelis_Church,_Hamburg
URI: Identifier für St. Michaelis
Ressource: St. Michaelis
http://commons.wikimedia.org/wiki/File:Michel_-_Noord.jpg
• Uniform Resource Identifier (URI): Zeichenfolge, die zur Identifizierung einer
abstrakten oder physischen Ressource dient
• eindeutiger dauerhafter Identifikator einer Ressource
Ressource - URI - Repräsentation
Seite 107
« Ceci n'est pas une pipe »  « Das ist keine Pfeife »
René Magritte: La trahison des images, 1928–29
Richtig! Das ist ein Bild einer Pfeife = Repräsentation
Bedeutung für Beschreibung von Bibliotheksressourcen: verschiedene
Metadatenstandards können in RDF integriert werden
„The Resource Description Framework (RDF) of the World Wide Web Consortium (W3C) is another
model that "provides a mechanism for integrating multiple metadata schemes" [NISO, 2004] for the
description of Web resources. It is a data model that provides a framework within which independent
communities can develop vocabularies that suit their specific needs and share vocabularies with
other communities. It utilizes the XML namespace to effectively allow RDF statements to reference a
particular RDF vocabulary or schema. „Zeng, M.L.; Chang, L.M. , http://www.dlib.org/dlib/june06/zeng/06zeng.html
Beispiel DC-RDF:
Die Ressource
‚http://ilrt.bristol.ac.uk/people/cmdjb/‘
hat den Titel ‚Dave Beckett´s
Homepage‘ und hat den Autor
‚Dave Beckett‘, hat Herausgeber
‚ILRT; University of Bristol‘ und hat
das Erstellungsdatum ‚31.7.2002‘
RDF - Resource Description Framework
Seite 108
1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF
und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:
RDF - Resource Description Framework - Übung
Seite 109
Subjekt Prädikat Objekt
Harry Potter wird verlegt bei Carlsen
2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel
(URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
dc:date
dc:creator
dc:titledc:identifier
dc:contibutor
Eigenschaften
ID: http://d-nb.info/990563480
Titel: Metadata for semantic and
social applications
Verfasser: Greenberg, Jane
(http://d-nb.info/gnd/136971857)
Jahr: 2008
1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF
und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:
RDF - Resource Description Framework - Lösung
Seite 110
Subjekt Prädikat Objekt
Harry Potter wird verlegt bei Carlsen
http://d-nb.info/990563480
http://d-nb.info/990563480
http://d-nb.info/990563480
http://d-nb.info/gnd/136971857
“Metadata for semantic and
social applications”
Greenberg, Jane
ID: http://d-nb.info/990563480
Titel: Metadata for semantic and
social applications
Verfasser: Greenberg, Jane
(http://d-nb.info/gnd/136971857)
Jahr: 2008
dc:date
dc:creator
dc:title
http://d-nb.info/990563480 „2008“
dc:creator
2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel
(URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
Meta-Modell: RDF-Schema
Seite 111
http://d-nb.info/gnd/4099309-7 dc:creator „Marx, Karl“
dc:Bibliographic
Resource
dc:Agentdc:creator
rdfs:class rdfs:classrdfs:property
rdfs:class
rdf:type
rdf:type
rdf:type
rdf:typerdf:type
rdfs:subClassOfrdfs:subClassOf
rdfs:subClassOf
domain range
RDFS
RDF
112
SKOS – Simple Knowledge
Organisation System
• formale Sprache zur Kodierung von
Wissensorganisationssystemen wie
Ontologien, Thesauri, Klassifikationen,
Taxonomien, andere Arten von kontrolliertem
Vokabular
• baut auf dem Resource Description
Framework (RDF) und RDF-Schema auf
• skos:broader (Oberbegriffe)
• skos:narrower (Unterbergiffe)
• skos:related (verwandte Begriffe)
• …
Seite 112
Web of Linked Data
RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) +
URIs für Entitäten = Web of Data
Cool URIs don't change
What makes a cool URI?
A cool URI is one which does not change.
What sorts of URI change?
URIs don't change: people change them.
http://www.w3.org/Provider/Style/URI
Seite 113
Semantic Web Stack
http://commons.wikimedia.org/wiki/File:Semantic_Web_Stack.png
114
Daten für das Semantic Web veröffentlichen:
Linked (Open) Data
Grundsätze von Linked Data
1. Verwende URIs als Name für Objekte.
2. Verwende http-URIs, so dass andere den Namen nachschlagen können.
3. Wenn jemand einen Namen nachschlägt, stelle hilfreiche Informationen zur
Verfügung und benutze Standards (RDF, SPARQL).
4. Stelle Links zu anderen URIs bereit, so das man Weiteres entdecken kann.
On the Web
Machine-readable data
Non-proprietary format
RDF standards
Linked RDF
Linked Open Data (LOD) ist Linked Data, welche
unter einer offenen Lizenz veröffentlicht wird, die
eine freie Nachnutzung nicht behindert.
5 Stars of Linked Open Data:
Seite 114
Web of Linked Data
Seite 115
2007
2009
2011
Linked Data in Bibliotheken
Seite 116
Warum?
• Sichtbarkeit im Web
maximieren
• Bestände leichter auffindbar
machen
• Nachnutzbarkeit
sicherstellen: insbesondere
durch nichtbibliothekarische
Domänen
• Bibliographische Nachweise
durch die Verknüpfung mit
anderen Informationen
anreichern
• Recherchemöglichkeiten
optimieren
EconStor goes LOD
Linked Data in Bibliotheken
Bereitstellen und Nutzen von kontrollierten Vokabularen und
Ontologien in RDF
• DBPedia:
• Projekt der Universität Leipzig, FU Berlin und OpenLink Software
• strukturierte Informationen aus Wikipedia extrahieren und in RDF bereitstellen
• Dreh- und Angelpunkt der Linked Data Cloud
• http://dbpedia.org/
• Standard Thesaurus Wirtschaft: http://zbw.eu/beta/econ-ws/about
• Gemeinsame Normdatei der Deutschen Nationalbibliothek:
http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html
• ….
Bereitstellen und Nutzen von Titeldaten in RDF
• hbz: http://lobid.org/about
• B3Kat (BSB, KOBV): http://lod.b3kat.de/doc
• …
Seite 117
Linked Data in Bibliotheken
Bereitstellen von Tools
• Culturegraph: Plattform für Dienste und Projekte rund um die Themen
Datenvernetzung, Persistent Identifier und Linked Open Data für kulturelle
Entitäten
• http://www.culturegraph.org/
Internationalisierung der bibliothekarischen Regelwerke
• Resource Description and Access (RDA)
• Umsetzung geplant in D für 2015
• Format-unabhängig
• Entwicklung ausgerichtet auf Nutzung im Semantic Web
• FRBR- und RDA-Vokabular
Seite 118
119
Metadata Registries
• Identifikation existierender Elemente verschiedener Schemas und Application Profiles
• Zur Nachnutzung und Konsultation bereitstellen
• Ermöglichen automatische Anfragen von Anwendungen, die die URIs, die einem
Schema enthalten sind, auflösen können.
“The presence of a metadata registry application promotes the wider adoption,
standardization and interoperability of metadata by facilitating its discovery, and reuse,
across diverse disciplines and communities of practice" [Dublin Core Metadata Registry].
http://rdvocab.info/
Seite 119
Metadata Registries
Cross-Domian
http://metadataregistry.org/
Domian-specific
http://dcmi.kc.tsukuba.ac.jp/dcregistry/
Seite 120
Linked Data Anwendungen
Seite 121
Zusammenfassung: Semantic Web
• Semantic Web: das „verstehende Web“: Informationen werden auf der Ebene
ihrer Bedeutung miteinander verknüpft.
• Voraussetzung:
• Maschinen-Interpretierbarkeit der Information  RDF
• Eindeutigkeit eines Konzepts (einer Person, einer Körperschaft, eines
Themas)  URI: Zeichenfolge, die zur dauerhaften Identifizierung einer
abstrakten oder physischen Ressource dient
• Vokabular zu Modellierung einer Ontologie: RDFS, OWL, SKOS
• RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für
Entitäten = Web of Data
• Bibliotheken nutzen und veröffentlichen Linked Open Data
• Recherche über Daten verschiedener Domänen
• Verbessert Nachnutzbarkeit
• Microformats und Microdata: „Semantic Web light“
Seite 122
7. Metadaten-Management in der ZBW
Seite 123
• Unterstützung beim Aufbau und Pflege der
Informationssysteme des Informationszentrums
• Koordination der Datenlieferungen
• Hilfestellung in allen Fragen zu Metadaten-
Formaten und Standards
Metadaten-Management in der ZBW
Querschnittsaufgabe
Metadaten-Management
Seite 124
• Mitarbeit in Abteilungs-übergreifende Teams der ZBW
• Mitarbeit in Drittmittel-Projekten
• Enge Zusammenarbeit mit der Abteilung „Innovative Informations-
systeme & Publikationstechnologien“
• Mitarbeit in Kooperation und (internationalen) Arbeitgruppen
Metadaten-Management in der ZBW
Metadaten-Management
Seite 125
Aufgaben des Metadaten-Managements
Metadatenstandards und Mapping
• Expertise bzgl. Metadaten-Standards und Regelwerken
• Erarbeiten von Crosswalks
Entwicklung und Weiterentwicklung von Metadatenformaten
Neue Systeme:
• Auswahl geeigneter Metadatenstandards gemäß der Anforderungen
an das System, Ggf. Kombination mehrerer Standards
• Entwicklung eines interoperablen Schemas
• Erstellung von Application Profiles (Dokumentation)
Bestehende Systeme, Z.B. EconStor, da|ra:
• Kontinuierliche Weiterentwicklung angepasst an sich wandelnde
Anforderungen
Seite 126
Koordination von Datenlieferungen
Weitere Aufgaben des Metadaten-Managements
• Bereitstellung /
Auswertung von
Testdaten und
Dokumentationen
• Dokumentation von
eingehend und
ausgehenden
Datenlieferungen
• Ansprechpartnerin
für alle Fragen
bzgl.
Metadatenformat,
Katalogisierung
und Bereitstellung
Seite 127
Qualitätsmanagement und Weiteres
Weitere Aufgaben des Metadaten-Managements
• Mitarbeit System-Entwicklung: Funktionen, die auf Metadaten aufbauen, z.B.
„Ähnliche Titel“, Merkliste, Exporte in Literaturverwaltungsprogramme
• Weitere Fragestellungen:
• Heterogene Sacherschließung in EconBiz
• Dublettenproblematik: Wie erkennen wir Dubletten?
• Qualitätsmanagement:
• Erstellen von Statistiken
• Datenanalysen: z. B. Prüfung einzelner Kategorien auf zulässige Inhalte
• Datenanalysen: z.B. Stand der Normierung: hohe Bedeutung für das
Zusammenführen von Beständen mit gleichen Merkmalen und
Zukunftsfähigkeit der Metadaten
Seite 128
Anforderungen an Metadaten-Managerinnen und -
Manager
bibliothekarische
Metadatenstandards
Regelwerke und
Frameworks
Vokabulare und
Normen
Normdateien
RAK-WB
Seite 129
• Analytisches Denken
• Spaß daran, sich ständig mit neuen
Aufgaben (Standards, Technologien)
zu beschäftigen und weiterzubilden
Methoden
Best Practices
Auszeichnungs-
sprachen
Technologien
Hochspezialisierter Arbeitsbereich im Bibliothekswesen
Anforderungen an Metadaten-Managerinnen und -
Manager
Seite 130
8. Berufsfeld Metadaten-Management im Kontext der
Bibliothek der Zukunft
Seite 131
I
LOVE
META
DATA
• Querschnittsaufgabe
• Kooperationen und Projekte
• Hoch-spezialisierter Arbeitsbereich
• Wissenschaftliche Bibliotheken: Zentrale Fachbibliotheken, Universitäts-
bibliotheken, Nationalbibliotheken, Verbundzentrale
• One-Person-Librarians
„Metadaten-Management? Wer muss das wissen?“
Bibliothek der Zukunft
Seite 132
l
Verweisung vom zweiten Bestandteil des
zusammengesetzten Namens
(§ 319)
Ist nach den Regeln ein zusammengesetzter Name in
der Ordnungsgruppe des Familiennamens
anzusetzen, so wird vom zweiten und von allen
weiteren Hauptbestandteilen des zusammengesetzten
Namens verwiesen.
Die bei der Verweisung übergangenen Teile des
zusammengesetzten Namens werden an das Ende
der Ordnungsgruppe der Vornamen gestellt (319,1).
l
RAK
Seite 133
Ausbildungsinhalte (2011/2012),
untersucht v. A. Schafrick
Bibliothek der Zukunft
Metadatenstandards
4
1
4
4
2
1
2
1
1
0
0
1
1
1
1
0
3
1
0
0
0
1
1
1
1
0
0
0
0 1 2 3 4 5 6 7
Nicht spezifizierte bibliothekarische
Metadatenformate
PICA +
PICA3
MAB2
MAB
MABxml
Marc21
ISBD
DC
TEI
VRA
ISAD G
EAD
Nicht spezifizierte archivarische
Metadatenformate
Wahlpflichtmodul
Pflichtmodul
Auswertung der Inhalte aus den jeweils aktuellsten
öffentlich zugänglichen Modulhandbüchern der
grundständigen Studiengänge in Deutschland im
Bereich Bibliothekswesen mit dem Bildungsziel
Bachelor of Arts (7 Hochschulen). Ergänzt um
Inhalte aus den Vorlesungsverzeichnissen WS
2011/2012 und SS 2012.
3
1
3
4
3
7
1
2
1
1
2
1
2
1
2
0
1
0
1
0
0
0
0 1 2 3 4 5 6 7
Forschungsdatenmanagement
Semantic Web (Linked Data,
Vokabulare, semantische
Persistent Identifer
(Systembeispiele, Aufgaben)
Digitale Langzeitarchivierung
(Archivierungsformate, ...)
Normierte Datenübergabe und -
integration in verteilten Systemen
Datenmodellierung/Datenmodelle
Aktuelle Entwicklungen bei
Standards zum Datenaustauch
Kommunikationsprotokolle (OAH
PMH, Z39.50)
Crosskonkordanzen, Terminologie
Mapping
Metdata-Crosswalks
Unterschiede Austauschformat,
Internformat …
Wahlpflichtmodul
Pflichtmodul
Seite 133
„Woher soll ich das wissen?“
Seite 134
„Metadaten-Management? Chancen?“
Bibliothek der Zukunft
Stellenanzeigen für Bibliothekarinnen und -Bibliothekare (Dipl. und B.A.)
in Bibliotheken des spezialisierten und hochspezialisierten im
deutschsprachigen Bereich vom 01.11.2011-30.04.2012 aus inetbib und
Bibliojobs
Seite 134
Automatisierung
• Automatische Indexierung und Klassifizierung
• Automatische Strukturerkennung von elektronischen Dokumenten
• Automatische Formalerschließung von elektronischen Dokumenten
• Schließen von Lücken bei Formal- und Sacherschließung
• Ergebnisse reichen derzeit nicht an intellektuelle Ergebnisse heran
• Semi-automatische Verfahren
• „Automatische Verfahren funktionieren nicht automatisch“
 Entwickeln und Betreuen von automatischen Verfahren
„In der Bibliothek arbeiten bald nur noch Informatiker“
Bibliothek der Zukunft
Seite 135
Seite 136
„Wer geht denn in die Bibliothek? Ist doch alles im Internet“
Bibliothek der Zukunft
Seite 136
„Zur Bibliothek“, bmgnrs,
http://www.flickr.com/photos/gigl/4807897633/
http://www.wer-weiss-was.de/theme199/article7098730.html
Buchlose Bibliothek wächst und gedeiht
Bibliothek der Zukunft
Seite 137
What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/
beyondthepdf2_day1_hires.jpg
Metadaten:
• (semi-)automatisch erstellte
Metadaten
• Metadaten für das Semantic Web
• RDF, RDFS
• OWL
• SKOS
• Ontologien statt Schlagwortlisten
• Modellierung
Seite 138
What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/
beyondthepdf2_day1_hires.jpg
Forschungsdaten:
• Mitarbeit bei der Entwicklung von
Forschungsumgebungen
• Entwicklung von
Publikationsplattformen
• Unterstützung / Beratung der
Forscher
• Langzeitarchivierung, Dokumentation
und Verbreitung
• ganz praktisch: z.B. Normierung von
Entitäten
• Data Librarian: unterstützt bei
Recherche nach FD und bei der
Erstellung von Metadaten
Seite 139
What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/
beyondthepdf2_day1_hires.jpg
Informationssysteme:
• Integration von Metadaten aus
verschiedenen Domänen:
Bibliotheken, Museen, Archive, …,
Internet
• Erleichterte Verfügbarkeit für
elektronische Dokumente
(Rechtemanagement)
• Dienst dort bereitstellen, wo die
Nutzer sind: von Facebook bis
Forschungsumgebung
Seite 140
What is our role?
Bibliothek der Zukunft
Seite 141
Auf Du und Du mit Dublin Core & Co.
k.jeude@zbw.eu
„Metadata is a love note to the future”, Cea.,
https://secure.flickr.com/photos/centralasian/8071729256/in/photostream/ Seite 142
Seite 143
Literatur
Seite 143
Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997
http://www.w3.org/DesignIssues/
Brand, A., Daly, F., Meyers, B., & National Information Standards Organization (U.S.)(2003):Metadata
demystified: A guide for publishers. Bethesda, Md: NISO Press.
(www.niso.org/standards/resources/Metadata_Demystified.pdf )
Caplan, Priscilla: Metadata Fundamentals for All Librarians. Chicago, 2003, ALA Editions
Dublin Core Metadata Initiative: DCMI Glossary. http://dublincore.org/documents/usageguide/glossary.shtml
Foulonneau, Muriel; Riley, Jenn (2008): Metadata for digital resources: implementation, systems design and
interoperability. Oxford: Chandos.
Greenberg, J. (2008): Dublin Core History and Basics. Tutorial ASIST DC 2008 http://dc2008.de/wp-
content/uploads/2008/09/tutorial-1.pdf
Harper, Corey (2010): Dublin Core Metadata Initiative: Beyond the Element Set – NISO Information
Standards Quarterly, v.22, no. 1, Winter 2010. http://www.niso.org/publications/isq/2010/v22no1
Hillman, D. I., & Westbrooks, E. L. (2004). Metadata in Practice. Chicago: ALA Editions.
In Baca, M., & Getty Research Institute. (2008). Introduction to metadata. Los Angeles (Calif.: Getty Research
Institute.
Miller, Eric (1998): An introduction to the resource description framework. In: D-Lib Magazine, Volume 4 Issue
5, May 1998. http://www.dlib.org/dlib/may98/miller/05miller.html
Mitchell, Nicole: Metadata Basics (2066): In: The Southeastern Librarian, Vol. 54: Iss. 3, Article 6 .
http://digitalcommons.kennesaw.edu/seln/vol54/iss3/6/
Literatur
National Information Standards Organization (U.S.). (2004): Understanding metadata. Bethesda, MD: NISO
Press. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf )
Pohl, Adrian (2011): Linked Data und die Bibliothekswelt. Hochschulbibliothekszentrum des Landes
Nordrhein-Westfalen). http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-
data_ODOK.pdf
Riley, Jenn (2008-2010): Seeing Standards: A Visualization of the Metadata Universe.
http://www.dlib.indiana.edu/~jenlrile/metadatamap
Söllner, Konstanze (2008):„Academic Librarian of the Future“-Woher kommen die Spezialisten für die neuen
Aufgaben in den Bibliotheken?. 102. Deutscher Bibliothekartag <Leipzig, 2013> http://nbn-
resolving.de/urn:nbn:de:0290-opus-14644
St. Pierre, Margaret; LaPlant, William P. (1998): Issues in Crosswalking Content Metadata Standards.(NISO
White Papers). Bethesda, MD: NISO. http://www.niso.org/publications/white_papers/crosswalk/
Weibel, S. et.al. (2002): Metadata Principles and Practicalities. In: D-Lib-Magazin, Vol. 8, No. 4, April 2002
Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part
I: Achieving Interoperability at the Schema Level. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006.
http://www.dlib.org/dlib/june06/chan/06chan.html
Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part
II: Achieving Interoperability at the Record and Repository Levels. In: D-Lib-Magazin, Vol. 12, No. 6, June
2006. http://www.dlib.org/dlib/june06/zeng/06zeng.html
Zeng, Marcia Lei, Jian Qin (2008): Metadata. New York: Neal-Schuman Publishers.
Seite 144
Webressourcen
K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/
Blogs
Metadata Matters: Bloggerin: Diane Hillmann: http://managemetadata.com/blog/
Coyle's InFormation: Bloggerin: Karen Coyle: http://kcoyle.blogspot.de/
Managing Metadata: Bloggerin: Laura Smart: http://library.caltech.edu/laura/
Metadata Discussion Group (Indiana University Libraries):
https://blogs.libraries.iub.edu/metadata/
Fachjournale
Journal of library metadata. 2008. New York, NY: Haworth Press.
http://www.informaworld.com/smpp/title~db=all~content=t792306902 .
D-Lib-Magazin (frei): http://www.dlib.org/
Seite 145
Webressourcen
Fortbildung
K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/
Hyperlinked Library MOOC: http://slisweb.sjsu.edu/about-slis/news/detail/free-
online-course-extends-learning-individuals-across-globe
OpenHPI: (Hasso-Plattner-Institut für Informatik) https://openhpi.de/
Tools
Dublin Core Tools zur Erstellung / Bearbeitung: http://www.dublincore.org/tools/
Marc-Tools, wie z.B. MarcEdit: http://www.loc.gov/marc/marctools.html
Notepad++: Freier Text-Editor für große Dateien. Suchen und Ersetzen mit
regulären Ausdrücken möglich
Firefox-AddOns: Dublin Core Viewer, Operator (Mikroformaterkennung)
Chrome-AddOn: Schema Explorer (Mikrodata), OpenLink Data Explorer
Seite 146
Metadatenstandards
• Dublin Core: www.dublincore.org
• Pica3/Pica+: (Katalogisierungsrichtlinie des Gemeinsamen Bibliotheksverbunds):
http://www.gbv.de/vgm/info/mitglieder/02Verbund/01Erschliessung/02Richtlinien/01
KatRicht/inhalt.shtml
• MARC21: http://www.loc.gov/marc/
• MODS: http://www.loc.gov/standards/mods/
• METS: http://www.loc.gov/standards/mets/
• Library of Congress Standards: http://www.loc.gov/standards/
• ONIX: http://www.editeur.org/83/Overview/
• TEI: http://www.tei-c.org/index.xml
• DDI: http://www.ddialliance.org/
• BibTeX: http://www.bibtex.org/
• RIS: http://www.refman.com/support/risformat_intro.asp
• COinS (KEV): http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html
Seite 147

Mais conteúdo relacionado

Mais procurados

Dublin Core In Practice
Dublin Core In PracticeDublin Core In Practice
Dublin Core In PracticeMarcia Zeng
 
Introduction to Metadata
Introduction to MetadataIntroduction to Metadata
Introduction to MetadataJenn Riley
 
Introduction to metadata management
Introduction to metadata managementIntroduction to metadata management
Introduction to metadata managementOpen Data Support
 
Encoded Archival Description (EAD)
Encoded Archival Description (EAD) Encoded Archival Description (EAD)
Encoded Archival Description (EAD) Farris Wahbeh
 
Metadata: a library perspective
Metadata: a library perspectiveMetadata: a library perspective
Metadata: a library perspectivejody perkins
 
“Open Data Web” – A Linked Open Data Repository Built with CKAN
“Open Data Web” – A Linked Open Data Repository Built with CKAN“Open Data Web” – A Linked Open Data Repository Built with CKAN
“Open Data Web” – A Linked Open Data Repository Built with CKANChengjen Lee
 
FRBR presentation by Bwsrang Basumatary
FRBR presentation by Bwsrang BasumataryFRBR presentation by Bwsrang Basumatary
FRBR presentation by Bwsrang BasumataryBwsrang Basumatary
 
FAIR and metadata standards - FAIRsharing and Neuroscience
FAIR and metadata standards - FAIRsharing and NeuroscienceFAIR and metadata standards - FAIRsharing and Neuroscience
FAIR and metadata standards - FAIRsharing and NeuroscienceSusanna-Assunta Sansone
 
DSpace-CRIS & OpenAIRE
DSpace-CRIS & OpenAIREDSpace-CRIS & OpenAIRE
DSpace-CRIS & OpenAIRE4Science
 
Data base management system
Data base management systemData base management system
Data base management systemashirafzal1
 
Master Data Management methodology
Master Data Management methodologyMaster Data Management methodology
Master Data Management methodologyDatabase Architechs
 
EAD, MARC and DACS
EAD, MARC and DACSEAD, MARC and DACS
EAD, MARC and DACSmillermax
 

Mais procurados (20)

Dublin Core In Practice
Dublin Core In PracticeDublin Core In Practice
Dublin Core In Practice
 
Metadata: Queen to King Content?
Metadata: Queen to King Content?Metadata: Queen to King Content?
Metadata: Queen to King Content?
 
Introduction to Metadata
Introduction to MetadataIntroduction to Metadata
Introduction to Metadata
 
Dublin Core Intro
Dublin Core IntroDublin Core Intro
Dublin Core Intro
 
Introduction to metadata management
Introduction to metadata managementIntroduction to metadata management
Introduction to metadata management
 
Metadata
MetadataMetadata
Metadata
 
Encoded Archival Description (EAD)
Encoded Archival Description (EAD) Encoded Archival Description (EAD)
Encoded Archival Description (EAD)
 
Metadata: a library perspective
Metadata: a library perspectiveMetadata: a library perspective
Metadata: a library perspective
 
Metadata: A concept
Metadata: A conceptMetadata: A concept
Metadata: A concept
 
“Open Data Web” – A Linked Open Data Repository Built with CKAN
“Open Data Web” – A Linked Open Data Repository Built with CKAN“Open Data Web” – A Linked Open Data Repository Built with CKAN
“Open Data Web” – A Linked Open Data Repository Built with CKAN
 
Special Topics: Data Provenance
Special Topics: Data ProvenanceSpecial Topics: Data Provenance
Special Topics: Data Provenance
 
FRBR presentation by Bwsrang Basumatary
FRBR presentation by Bwsrang BasumataryFRBR presentation by Bwsrang Basumatary
FRBR presentation by Bwsrang Basumatary
 
Introduction to EAD
Introduction to EADIntroduction to EAD
Introduction to EAD
 
Dublin core Presentation
Dublin core PresentationDublin core Presentation
Dublin core Presentation
 
FAIR and metadata standards - FAIRsharing and Neuroscience
FAIR and metadata standards - FAIRsharing and NeuroscienceFAIR and metadata standards - FAIRsharing and Neuroscience
FAIR and metadata standards - FAIRsharing and Neuroscience
 
DSpace-CRIS & OpenAIRE
DSpace-CRIS & OpenAIREDSpace-CRIS & OpenAIRE
DSpace-CRIS & OpenAIRE
 
Metadata harvesting Tools
Metadata harvesting ToolsMetadata harvesting Tools
Metadata harvesting Tools
 
Data base management system
Data base management systemData base management system
Data base management system
 
Master Data Management methodology
Master Data Management methodologyMaster Data Management methodology
Master Data Management methodology
 
EAD, MARC and DACS
EAD, MARC and DACSEAD, MARC and DACS
EAD, MARC and DACS
 

Semelhante a Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenMartin Voigt
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebAlexander Haffner
 
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBerlinOpenDataDay
 
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKDIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKStaatsbibliothek zu Berlin
 
Sitzung 11
Sitzung 11Sitzung 11
Sitzung 11scuy
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenBjörn Muschall
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 
DOI-Registrierung mit da|ra
DOI-Registrierung mit da|raDOI-Registrierung mit da|ra
DOI-Registrierung mit da|raRalf Toepfer
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und RepositorienPascal-Nicolas Becker
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...redsys
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebKatrin Weller
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in MetadatenverwaltungOpen Data Support
 
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...ETH-Bibliothek
 

Semelhante a Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft (20)

BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web
BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic WebBIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web
BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web
 
Vernetzungstage 2011
Vernetzungstage 2011Vernetzungstage 2011
Vernetzungstage 2011
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in Massendaten
 
Überblick Semantic Web
Überblick Semantic WebÜberblick Semantic Web
Überblick Semantic Web
 
Normdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im WebNormdaten - die Aggregatoren im Web
Normdaten - die Aggregatoren im Web
 
Linked Library Data & RDA
Linked Library Data & RDALinked Library Data & RDA
Linked Library Data & RDA
 
BIT SoSem 2014 | Basisinformationstechnologie II - 03: Semantic Web
BIT SoSem 2014 | Basisinformationstechnologie II - 03: Semantic WebBIT SoSem 2014 | Basisinformationstechnologie II - 03: Semantic Web
BIT SoSem 2014 | Basisinformationstechnologie II - 03: Semantic Web
 
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
 
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEKDIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
DIGITAL HUMANITIES-PROJEKTE DER STAATSBIBLIOTHEK
 
Sitzung 11
Sitzung 11Sitzung 11
Sitzung 11
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
Meatdaten
MeatdatenMeatdaten
Meatdaten
 
DOI-Registrierung mit da|ra
DOI-Registrierung mit da|raDOI-Registrierung mit da|ra
DOI-Registrierung mit da|ra
 
16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien16. DINI-Jahrestagung: Linked Data und Repositorien
16. DINI-Jahrestagung: Linked Data und Repositorien
 
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
 
Wir sprechen die Sprachen der Daten - Metadaten-Management im Leibniz-Informa...
Wir sprechen die Sprachen der Daten - Metadaten-Management im Leibniz-Informa...Wir sprechen die Sprachen der Daten - Metadaten-Management im Leibniz-Informa...
Wir sprechen die Sprachen der Daten - Metadaten-Management im Leibniz-Informa...
 
Wissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
 
Einführung in Metadatenverwaltung
Einführung in MetadatenverwaltungEinführung in Metadatenverwaltung
Einführung in Metadatenverwaltung
 
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
Entwicklung von Standards und Best Practices im Bereich der Forschungsdatenpu...
 

Auf Du und Du mit Dublin Core & Co. - Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft

  • 1. Die ZBW ist Mitglied der Leibniz-Gemeinschaft Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft Kirsten Jeude 12.04.2013 Metadaten-Management im Leibniz-Informationszentrum Wirtschaft „metadata“ Shira Golding, https://secure.flickr.com/photos/boojee/3743753784/in/photostream
  • 2. Seite 2 Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten- Management im Kontext der Bibliothek der Zukunft 1. Was sind Metadaten? 2. Metadatenstandards (inkl. Exkurs XML) 3. Application Profiles und Interoperabilität 4. Mapping 5. Schnittstellen 6. Metadaten im Semantic Web 7. Metadaten-Management in der ZBW 8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft Gliederung
  • 3. 1. Was sind Metadaten? Seite 3
  • 4. Was sind Metadaten? Definitionen über Definitionen • „… are (structured) data about data.“ Miller, Eric: An introduction to the resource description framework. In: D-Lib Magazine, (May) 1998; Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources; u.v.m. • „Unter Metadaten ("Daten über Daten") versteht man strukturierte Daten, mit deren Hilfe eine Informationsressource beschrieben und dadurch besser auffindbar gemacht wird.“ SUB Göttingen Metadata Server • „… structured, encoded data that describe characteristics of information-bearing entities to aid in their identification, discovery, assessment, and management of the described entities“ American Library Association´s Committee on Cataloguing • „… is any type of formal description of a resource, regardless of format“ Mitchell, Nicole: Metadata Basics (The Southeastern Librarian, Fall 2006) • „…is cataloging done by men“ Delsey, Tom, National Library of Canada • „… is machine understandable information about web resources or other things.“ Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997. • „An item of metadata is a relationship that someone claims to exist between two entities.“ Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources • „I like to think of metadata as data which removes from a user (human or machine) the need to have full advance knowledge of the existence or characteristics of things of potential interest in the environment“ Lorcan Dempsey, zit. in: Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources Seite 4
  • 5. Metadata “is machine understandable information about web resources or other things.“ (Tim Berners-Lee) Web-Ressourcen: Seite 5
  • 6. Andere Dinge: Bücher und Zeitschriften etc.: Museums-Objekte: Bilder: Tonträger: Personen: Metadata “is machine understandable information about web resources or other things.“(Tim Berners-Lee) Seite 6
  • 7. Karteikarte im Zettelkatalog Metadaten – getrennt vom Objekt Metadaten – im Objekt enthalten CIP (Cataloging in Publication) Datensatz in bibliographischer Datenbank Header einer HTML- Seite mit Metadaten Metadata „is any type of formal description of a resource, regardless of format“ (Nicole Mitchell) Metadaten in Form von COinS (Mikroformat) in HTML-Seite Seite 7
  • 8. Metadata „are (structured) data about data“ (Eric Miller) Metadaten sind „Daten über Daten“ Daten - Buch „Daten über Daten“ Metadata / Marcia Lei Zeng and Jian Qin Zeng, Marcia Lei *1956-* Qin, Jian *1956-* London : Facet, 2008 xvii, 365 p. : ill. ; 23cm Includes bibliographical references and index 1-85604-655-9, 978-1-85604-655-8 (pbk) Metadaten STRUKTURIERTE Metadaten-Schema Titel Verfasser Sonstige beteil. Person Erschienen: Umfang Anmerkung ISBN Schlagwörter Seite 8
  • 9. Metadata „are (structured) data about data“ (Eric Miller) Metadatenformate (maschinen-lesbar) Bezeichner eines Merkmals (Menschen-lesbar) 4000 Suchen mithilfe semantischer Metadaten (PICA3) 021A $a Suchen mithilfe semantischer Metadaten (PICA+) 331Suchen mithilfe semantischer Metadaten (MAB) 245 00 $a Suchen mithilfe semantischer Metadaten (MARC21) <titleInfo><title>Suchen mithilfe semantischer Metadaten</title></titleInfo> (MODS) Grundsätzlich und pragmatisch Seite 9
  • 10. PPN: Titel: Verfasser: Sonst. Personen: Erschienen: Umfang: Anmerkung: ISBN: Schlagwörter: Mehr zum Thema: Zeng, Marcia LeiVerfasser: Metadaten-Element Metadatensatz folgt Regeln (z.B. Nachname Komma Leerzeichen Vorname) Element-Wert 571230652 Metadata / Marcia Lei Zeng and Jian Qin Zeng, Marcia Lei *1956-* Qin, Jian *1956-* London : Facet, c2008 xvii, 365 p. : ill. ; 23cm Includes bibliographical references and index 1-85604-655-9, 978-1-85604-655-8 (pbk) : £39.95 *Metadaten / *Metadata Dewey-Dezimalklassifikation: 025.3 Metadata „are (structured) data about data“ Seite 10
  • 11. Metadata is „[…] to aid in their identification, discovery, assessment, and management of the described entities“ AUFGABEN von Metadaten (FRBR User Tasks) 1. Verlässliches FINDEN ermöglichen: Recherche nach vom Benutzer festgelegten Kriterien. 2. IDENTIFIZIEREN: Unterscheiden, was verschieden ist, z.B. Unterscheidung von zwei Texten oder Aufnahmen, die mit demselben Titel veröffentlicht wurden. 3. AUSWÄHLEN: Zusammenführen, was zusammengehört, den Benutzerbedürfnissen entsprechend : z.B. Auswahl eines Texts in einer Sprache, die der Benutzer versteht 4. Zu Gewähltem ZUGANG ERHALTEN: z.B. Bestellung für eine Publikation abgeben FRBR: Functional Requirements for Bibliographic Records Seite 11
  • 12. Metadata is „[…] to aid in their identification, discovery, assessment, and management of the described entities“ TYPEN von Metadaten Deskriptive Metadaten : Beschreiben eine Ressource zum Zweck der Entdeckung, der Identifikation, der Auswahl und des Zugangs Strukturelle Metadaten: Beschreiben die interne Organisation einer Ressource. Beschreiben, wie miteinander verbundene Objekte miteinander in Beziehung stehen, z.B. wie Seiten geordnet werden müssen, damit ein Kapitel entsteht. Administrative Metadaten: „meta-metadata“; Informationen, die helfen eine Ressource zu verwalten: Technische Metadaten: Enthalten Informationen über Format und Dateityp Metadaten für das Rechtemanagement: Enthalten Informationen, die für die Berechtigung des Zugriffs und Informationen über das geistige Eigentum dienen Herkunfts-Metadaten (Provenienz-Metadaten): Metadaten über die Herkunft der Ressource: Feststellung der Vertrauenswürdigkeit; Bewahrung der Nutzbarkeit Seite 12
  • 13. • Formale Beschreibung einer Ressource • Strukturierte „Daten über Daten“ • Ein Metadatensatz besteht aus Metadaten-Elementen und den dazugehörigen Werten • Für eine Vielzahl an Dingen (Texte, Bilder, Objekte, Personen, etc.) • Getrennt vom beschriebenen Objekt oder enthalten im Objekt • menschen-lesbar, maschinen-lesbar (und maschinen-interpretierbar) • Aufgaben von Metadaten sind die Unterstützung beim Finden, Identifizieren, Auswählen einer Ressource, sowie Zugang zu ihr erhalten • Es gibt verschiedene Typen von Metadaten: deskriptive, administrative, technische Metadaten, Struktur- und Provenienz-Metadaten, Metadaten für das Rechtemanagement Seite 13 Zusammenfassung: Was sind Metadaten?
  • 15. Metadatenstandards Standards? "The nice thing about standards is that you have so many to choose from. Furthermore, if you do not like any of them, you can just wait for next year's model." Quelle: Andrew Tanenbaum, Computer Networks, 2nd edn., p. 254 Ein Metadatenstandard • sorgt für: Konsistenz der Metadaten • verbessert: Metadatennutzung • erlaubt: Austausch von Metadaten und die Verlinkung von Objekten anwendungsübergreifend Seite 15
  • 16. Metadatenstandards „A content metadata standard is defined as an open specification that itemizes a set of elements and their meanings. Each element is tagged with an identifier (e.g., "Title", "Author") that distinguishes the element from other elements within the standard. In addition, each element has a set of constraints or rules specifying the allowable content of the element and its relationship to other elements within the standard.“ (http://www.niso.org/publications/white_papers/crosswalk/ ) "A metadata schema provides a formal structure designed to identify the knowledge structure of a given discipline and to link that structure to the information of the discipline through the creation of an information system that will assist the identification, discovery, and use of information within that discipline" . American Library Association Committee on Cataloging: Description and Access (CC:DA) Task Force on Metadata Seite 16
  • 17. Aufbau eines Metadaten-Standards am Beispiel Dublin Core Dublin Core Metadata Initiative (DCMI) Zunächst für die Beschreibung von Webressourcen 15 Kern-Elemente (“Core”): Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, and Rights Alle optional und wiederholbar Reihenfolge der Elemente beliebig http://dublincore.org/documents/dces/ Title ”Metadata Demystified” Creator ”Brand, Amy” Creator ”Daly, Frank” Creator ”Meyers, Barbara” Subject ”metadata” Description ”Presents an overview of metadata conventions in publishing.” Publisher ”NISO Press” Publisher ”The Sheridan Press” Date ”2003-07" Type ”Text” Format ”application/pdf” Identifier ”http://www.niso.org/standards /resources/Metadata_Demystified.pdf” Language ”en” Seite 17
  • 18. Dublin Core Metadata Element Set Dublin Core Simple: 15 Elemente:  titel Titel  creator Verfasser oder Urheber  contributor Mitarbeiter  publisher Verlag  subject Thema des Inhalts (Sacherschließung)  date Datum  coverage Abdeckung  description Beschreibung  language Sprache  type Art, Gattung  format Format  identifier Eindeutige Identifizierung  relation Beziehung  source Quelle  rights Rechte Seite 18
  • 19. Dublin Core - Metadatenelemente Element (property): Merkmal / Eigenschaft einer Ressource, wie Titel, Autor etc. „An Element is a property of a resource. As intended here, "properties" are attributes of resources – characteristics that a resource may "have", such as a Title, Publisher, or Subject.“ (DCMI Glossary) Seite 19
  • 20. Dublin Core Element Set - Übung DC element value title creator contributor publisher subject date coverage DC element value description language type format identifier relation rights Sprache: rumänisch, englisch Seite 20
  • 21. Dublin Core Element Set - Übung: Lösung Sprache: rumänisch, englisch DC element value title Intelectuali Români implicati în dezvoltarea civilizatiei economice title Romanian intellectuals inolved in the development of the economic civilization creator Saizu, Ioan contributor ----- publisher Ed. Acad. Romane subject Wirtschaftsgeschichte subject Rumänien date 2003 coverage Rumänien DC element value description -------------- language rumänisch language englisch type Buch / Book format 308 S. identifier 973-270983-9 relation --------------- rights --------------- Seite 21
  • 22. Dublin Core Metadata Terms 15 Elemente bieten wenig Differenzierung. Was tun?  Dublin Core Metadata Terms Element Refinement: Verfeinerung der Bedeutung eines Elements Die Refinements können als Unterbegriff des Elements verstanden werden. Beispiel: Element „Description“ mit den Refinements „Abstract“ oder „Table of Contents“ 55 Terms: http://dublincore.org/documents/dcmi-terms/ dc.description Kann jegliche Art von Beschreibung enthalten dcterms.abstract Hier sind nur Abstracts zulässig dcterms.tableOfContents Hier sind nur Inhaltsverzeichnisse zulässig Seite 22
  • 23. Encoding Schemes Weitere semantische und syntaktische Differenzierung bieten Encoding Schemes Wie, in welcher Form wird das Element beschrieben? Kodierungs-Schema, kontextabhängige Informationen oder Parsing-Regeln (Syntax- Analyse-Regeln), die dazu beitragen, den Wert eines Elements zu interpretieren. Semantics is about meaning; syntax is about form Weibel, S. et.al. (2002) Semantik: Semantik (von Altgriechisch σημαίνειν sēmaínein ‚bezeichnen‘, ‚zum Zeichen gehörig‘), auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen. Zeichen können in diesem Fall Wörter, Phrasen oder Symbole sein. Die Semantik beschäftigt sich typischerweise mit den Beziehungen zwischen Zeichen und Bedeutungen dieser Zeichen. [http://de.wikipedia.org/wiki/Semantik] Syntax: die rein formalen Beziehungen zwischen (sprachlichen) Zeichen, z.B. Datumsangabe: soll in der Syntax YYYY-MM-DD erfolgen. Seite 23
  • 24. Vocabulary Encoding Schemes Vocabulary Encoding Scheme (VES): Beschreibt, dass der Wert eine Bezeichnung aus einem kontrollierten Wortschatz ist, z.B. Wert = Klasse (Notation) aus der DDC, Deskriptor aus dem Standard Thesaurus Wirtschaft (STW), etc. Bsp. Element „subject“ mit dem Encoding Scheme „DDC“ <dcterms:subject xsi:type „dcterms:DDC“>330</dcterms:subject> Achtung! Jetzt kommt ein Thema, und zudem stammt der Wert aus der DDC Seite 24
  • 25. Vocabulary Encoding Schemes: Klassifikationen – Thesauri – Schlagwörter und mehr Klassifikationen DDC Dewey Decimal Classification UDC Universelle Dezimalklassifikation BK Basisklassifikation LCC Library of Congress Classification RVK Regensburger Verbundklassifikation JEL: Klassifikation des Journal of Economic Literature Thesauri STW Standard Thesaurus Wirtschaft TGN Getty Thesaurus of Geographic Names TheSoz Theaurus Sozialwissenschaften IBLK Europäischer Thesaurus Internationale Beziehungen und Länderkunde MeSH Medical Subject Headings AGROVOC Agrarwissenschaften, Forstwirtschaft, Fischerei, Nahrungsmittel und verwandter Gebiete INFODATA Thesaurus Informationswissenschaft Normdateien (authority files) GND Gemeinsame Normdatei (Personen, Körperschaften , Schlagwörter) LCSH Library of Congress Subject Headings Rameau Normdatei der BnF VIAF Virtual International Authority File Sonstiges kontrolliertes Vokabular IMT Internet Media Type (auch MIME- Type ) klassifiziert den Dateityp z.B. für DC-Element „format“ DCMIType Vocabulary Ressourcentype z.B. für DC-Element „type“ Seite 25
  • 26. Syntax Encoding Schemes Syntax Encoding Scheme (SES): Gibt an, wie die Zeichenketten, die bei der Beschreibung eines Objekts verwendet werden, aufgebaut sein müssen und regelt damit die syntaktische Struktur der Beschreibung, z.B. „JJJJ-MM-TT" als Standardausdruck eines Datums. Bsp. Element „Date“ mit Encoding Scheme „JJJJ-MM-TT“ <dcterms:date xsi:type dcterms:W3CDTF>2007-12-04</dcterms:date> Achtung! Jetzt kommt ein Datum und außerdem hat es das Format JJJJ- MM-TT Seite 26
  • 27. Syntax Encoding Schemes Normen und weitere Standards ISO 8601 Data elements and interchange formats - Information interchange - Representation of dates and times W3C-DTF „defines a profile of ISO 8601, the International Standard for the representation of dates and times „ DCMI Period Encoding Scheme (Zeiträume): „for identifying a single time interval using its limits „ DCMI BOX Encoding Scheme (geographische Räume): „method for identifying a region of space using its geographic limits and representing that information as a value string.“ DCMI Point Encoding Scheme (geographischer Punkt): „a mechanism for indicating a point in space using its geographic coordinates and representing that information as a value string. „ URIs (Uniform Resource Identifier) URL Uniform Resource Locator URN Uniform Resource Name Handle Handle DOI Digital Objekt Identifier PURL Persistent Uniform Resource Locator Weitere Identifier ISBN International Standard Book Number: ISBN 978-3-7657-2781-8 ISSN International Standard Serial Number: ISSN 4177-0815 BICI Book Item and Component Identifier SICI Serial Item and Contribution Identifier (ANSI/NISO standard Z39.56). ISMN International Standard Music Number Seite 27
  • 28. Syntax and Vocabulary Encoding Schemes RFC 3066: Vorläufer der ISO-639 ISO 639 Sprachen (Sprachcodes): ISO 639-1 (Alpha-2 Code) ISO 639-2 (Alpha-3 Code) ISO 639-3 (Alpha-3 Code for comprehensive coverage of languages) Semantisch im Hinblick auf das enthaltene Vokabular. Syntaktisch im Hinblick auf die Kodierung in bestimmter Anzahl Zeichen  automatisch prüfbar (Plausibilitätsprüfung). http://upload.wikimedia.org/wikipe dia/commons/thumb/9/95/ISO_63 9_Schematische_Darstellung.svg /700px- ISO_639_Schematische_Darstell ung.svg.png Seite 28
  • 29. Metadaten-Standards und -Schemas definieren zulässige Elemente und ihre Bedeutung (Semantik), sowie ihre Form (Syntax): • Sachliche Definition des Inhalts (content rules). Diese besagen, wie die Werte für das Datenelement ausgewählt und repräsentiert werden. • Regeln über die Form des Feldinhalts (representation rules): z.B. Regeln über die Groß- und Kleinschreibung • Regeln über die Syntax des Inhalts, also wie der Inhalt codiert werden muss: z.B. ein Datum muss immer in der Form YYYY-MM-TT eingegeben werden (syntax encoding scheme) • Regeln über die zulässig Inhalte (content values), z.B. der Inhalt des Feldes muss aus einem kontrollierten Vokabular, wie z.B. dem STW, der DDC, der UDC, der BK, etc. stammen (vocabulary encoding scheme) • Angaben zur Wiederholbarkeit und Verpflichtung eines Elements • Angaben wie verschiedene Elemente miteinander in Beziehung stehen Zusammenfassung: Aufbau eines Metadatenstandards Seite 29
  • 30. Zusammenfassung: Aufbau von Dublin Core • Dublin Core Metadata Element Set = 15 Elemente (Dublin Core Simple) • Dublin Core Metadata Terms (Dublin Core Qualified) • Element Refinements = 55 Elemente • Encodings Schemes und Refinements sind „Qualifier“ • Dublin Core Qualifier: http://dublincore.org/documents/usageguide/qualifiers.shtml • Dublin Core auf Deutsch: KIM - Kompetenzzentrum Interoperable Metadaten Seite 30
  • 31. Prinzipien von Dublin Core One-to-One-Principle - Das 1:1-Prinzip: Jede Beschreibung (decription) steht für ein und nur ein Objekt (Ressource), z.B. eine Beschreibung für einen gedruckten Text, eine weitere für die elektronische Ausgabe. Dumb-Down-Principle – Prinzip der Vereinfachung: Die Bedeutung eines Elements kann verfeinert, aber nicht erweitert werden. Beispiel: Element „description“ mit den refinements „ToC“ oder „Abstract“ (dumb down der Eigenschaft und des Wertes) Appropriate Values – Angemessene / entsprechende Inhalte: „Best Practice“ : menschen- und maschinelesbar. Seite 31
  • 32. Prinzipien von Dublin Core 1. Simplicity: Einfachheit der Beschreibung 2. Semantic interoperability: Semantische Interoperabilität 3. International consensus: Internationale Übereinkunft über Standard 4. Interdisziplinary: Interdisziplinär einsetzbar 5. Extensibility: Erweiterbarkeit, keine Beschränkung auf DC-Elemente 6. Modularity: Modular, im Baukasten-Prinzip verwendbar 7. Modifiability: Jedes Element kann durch die Angabe eines Attributs verändert werden 8. Optionality: keine Pflichtfelder 9. Repeatability: Alle Elemente können mehrmals in einem Datensatz auftreten 10. Independency: Unabhängigkeit von einer spezifischen Syntax Seite 32
  • 33. Metadatenformate bibliographisch / deskriptiv Metadatenstandard ist nicht gleich Metadatenformat Dublin Core Metadatenstandard • als .txt-Datei • als .html- oder .xhtml-Datei • als .xml-Datei • als .rdf-Statements Syntax Guidelines für die korrekte Konstruktion von DC-Datensätzen in diese Formate: http://dublincore.org/specifications/ Grundsätzlich: • Metadatenstandards als Text-Standard entwickelt und nachträglich weitere Repräsentationen • Originäre XML-Standards • Proprietäre Formate, z.B. .mrc für MARC  Metadatenformat, z.B. DC-DS-XML Seite 33
  • 34. Exkurs XML  Extensible Markup Language = erweiterbare Auszeichnungs- Sprache  Beispiele für Auszeichnungssprachen: HTML (Hypertext Markup Language), SGML (Standard Generalized Markup Language), XML  Standard zur Erstellung von maschinen- und menschenlesbaren Dokumenten  Der Standard wurde vom World Wide Web Consortium (W3C) definiert  Befehle in Form von semantischen tags: <titel> </titel>, <date> </date>, <creator></creator> <befehl>Information</befehl> Seite 34
  • 35. Unterschiede zwischen HTML und XML Unterschied zu HTML  Tags sind nicht festgelegt. Sie werden für spezielle Anwendung definiert: Datenbank 1: <autor>Marx, Karl<autor/> Datenbank 2: <verfasser>Marx, Karl<verfasser/>  HTML „Kann man sehen“ = Auszeichnung der Strukturierung von Inhalten  XML transportiert Semantik = logische Auszeichnung der Inhalte Gemeinsamkeiten  Auszeichnungssprachen  Stammen von SGML ab  Befehle in Form von tags  Textformat (im Sinne von Nicht-binär) <h1>Metadaten für Einsteiger</h1> Jetzt kommt eine Überschrift: 20 pt., fett Ende Überschrift: Absatz- schriftart HTML <titel>Metadaten für Einsteiger</titel> Hier kommt der Titel der Ressource Hier endet der Titel der Ressource XML Präsentation Bedeutung Seite 35
  • 36. XML - Eigenschaften • Trennt strikt zwischen Daten und Verarbeitung der Daten: Welche Software für die Verarbeitung verwendet wird, ist nicht festgelegt. • XML = Textformat: erleichtert es Menschen die enthaltene Information zu verstehen und macht unabhängig von bestimmten technischen Implementierungen • Für hoch-strukturierte Daten (aus relationalen Datenbanken) und semi- strukturierte Daten (von Menschen verfasste Texte) • Einfach: leichter zu erlernen und leichter zu implementieren als Vorfahren (SGML) .csv vs. .xml Seite 36
  • 37. XML - Eigenschaften • Flexibel: da „tags“ (Bezeichner) in XML nicht festgelegt sind, kann jeder Betreiber sein eigenes Format entsprechende seiner Bedürfnisse erstellen. • Flexible vs. Interoperabel: DB1: <verfasser>, DB2: <autor>, aber identische Semantik • Metadatenformate ausgedrückt in XML: 100 1 $aSchultz, Theodore Paul,$0(DE- 601)060006277. 245 10 $aChanging world prices, women's wages, and the fertility transition :$bSweden, 1860 - 1910 /$cT. Paul Schultz. MARC21 MARC21 in XML Seite 37
  • 38. Metadatenstandards in XML Metadata Object and Description Schema • Originärer XML-Standard • Entwickelt als Kompromiss zwischen dem komplexen MARC21 und dem einfachen Dublin Core • Für elektronische Ressourcen • Entwickelt vom Network Development and MARC Standards Office der LoC • Bildet Teile der MARC21-Elemente ab, bei Standard-Konvertierung Informationsverlust Seite 38
  • 39. Machine-Readable Cataloging - MARC21 Internationales Austausch- und Speicherformat • für bibliographische Nachweise in Bibliothekskatalogen • Entwickelt von der LoC • ANSI/NISO Z39.2 • Viele Dialekte 1000 Elemente mit Unterfeldern und Indikatoren • ca. 60 am häufigsten verwendete • Fixed Fields (00X) Kat.-Regelwerk: AARC2 Format: .mrc / .marc Tools: Marc-Editor „MarcEdit“ xxxxxnaa a22yyyyy c 4500 001 592906469 003 DE-601 005 20090728100724.0 008 090304s2008 000 0 eng d 016 7 $a7153508$2DE-600 040 $aGBVCP$bger$erakwb 041 0 $aeng 100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE- 588)133059545 245 10$aEscaping the unemployment trap :$bthe case of East Germany /$cChristian Merkl; Dennis J. Snower 300 $bgraph. Darst. 650 7$81.1x$aLangzeitarbeitslosigkeit$0(DE- 601)091374367$0(DE-STW)18124-6$2stw 650 7$81.2x$aArbeitsproduktivität$0(DE- 601)091347742$0(DE-STW)10440-1$2stw […] 700 1 $aSnower, Dennis J.$eAuthor$4aut$0(DE- 601)366752960$0(DE-588)124825109 773 08$iIn: $tJournal of comparative economics$dAmsterdam : Elsevier$gVol. 36, No. 4 (2008), p. 542-556$q36:4<542-556$w(DE-601)130445541$x0147-5967 773 08$iIn: 900 $aGBV$bZBW Kiel <206> 952 $d36$j2008$e4$c12$h542-556 954 $a26$b923675930$c01$x0206 http://www.loc.gov/marc/ Seite 39
  • 40. 650 = Sachschlagwort Indikator 1 = undefiniert Indikator 2 = Quelle des Vokabular wird spezifiziert in Unterfeld 2 Unterfeld a = Deskriptor Unterfeld 0 = Identifier der Ressource in der Datenbank „DE-601“ (GBV) Unterfeld 2 = Deskriptor stammt aus dem STW Unterfelder und Indikatoren Seite 40
  • 41. Project of Integrated Catalogue Automation - PICA PICA+: Datenbank-Format PICA3: Katalogisierungssicht u.a. GBV, SWD, HEBIS, DNB für bibliographische Nachweise in Bibliothekskatalogen ca. 1300 Informationseinheiten: Elemente mit Unterfeldern Verschiedene Satztypen, die miteinander verknüpft sind (Hierarchische Datensätze) Kat.-Regelwerk: RAK (D) 001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/00 $9091347742$8Arbeitsproduktivität 045D/00 $9091384966$8Qualifikation 045D/49 $b49 101B $004-03-09$t09:15:56.000 Seite 41
  • 42. Pica3 - Pica+ Katalogisierungssicht Pica3 Datenbanksicht PICA+ Seite 42
  • 43. 43 Pica3 - Pica+ Steuerzeichen in Pica3 sind Unterfelder (subfields) in Pica+ Subfield Eine individuelle Informationseinheit in einer strukturierten Datei. Eine Untergliederung eines Feldes. Beispiel: ein Feld für Titelangaben hat mehrere Unterfelder: HST, Zusatz, Verfasserangabe Seite 43
  • 44. Beispiele für Metadatenstandards Metadatenstandards 1.für bibliographische Ressourcen: z.B. Pica+, MODS, DC 2.für den Datentausch: z.B. MAB 2, MARC21, ONIX 3.für Multimedia-Objekte: z.B. MIX (Bilder), MPEG-7/21 (Video) 4.für digitale Sammlungen: z.B. METS (Wrapper) 5.für sozialwiss. Forschungsdaten: z.B. DDI, SDMX 6.für Archive (Findbücher): z.B. EAD 7.für die Langzeitarchivierung: z.B. PREMIS 8.für die Strukturauszeichnung von Dokumenten: z.B. TEI 9.für Museumsobjekte: z.B. LIDO Seite 44
  • 45. Seeing Standards: A Visualization of the Metadata Universe (Jenn Riley) http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards.pdf Seite 45
  • 46. DOKUMENTATION eines Metadaten-Standards • „Uses and Features“ • „Usage Guidelines“ • „Implementation Guidelines“ • „Schemas and Outline“ • „Data Dictionary“ • “Specification” • Encoding Guidelines • Code Lists • Beispiel-Datensätze • Tutorials • Mailinglisten und Foren • Einsatzgebiet und –möglichkeiten • Anwendungsregelwerk • Aufzählung und genaue Definition der Elemente • Kodierungs-Regeln • Kodierungs-Listen • Beispiel-Datensätze • Anleitungen mit Übungen • Mailinglisten und Foren Metadatenstandards kennenlernen 100 1 $aMerkl, Christian$0(DE- 601)533312205$0 (DE- 588)133059545 Seite 46
  • 47. • Metadatenstandards sorgen für die Konsistenz der Metadaten und verbessern damit Nutzung und Austausch • Ein Metadatenstandard ist aufgebaut aus Metadaten-Elementen (Eigenschaft / Merkmal einer Ressource; property) • Metadatenelemente werden definiert hinsichtlich ihrer Bedeutung (Semantik) und hinsichtlich der Form (Syntax) • Es gibt Vocabulary Encoding Schemes (Klassifikationen, Thesauri, kontrolliertes Vokabular, Normdateien, Schlagwortlisten) • und Syntax Encoding Schemes (Normen, URIs, weitere Identifier) zur genaueren Definition von Metadatenelementen • Zur Definition eines Elements gehört auch eine Aussage über die Wiederholbarkeit und Verpflichtung eines Elements, sowie darüber, wie einzelne Elemente miteinander in Beziehung stehen. Seite 47 Zusammenfassung: Metadatenstandards
  • 48. • Metadatenstandard ist nicht gleich Metadatenformat: ein Standard (z.B. Dublin Core) kann in verschiedenen Formaten auftreten: z.B. DC-HTML, DC-XML, DC-RDF • XML eignet sich, weil es menschenlesbar und gleichzeigt maschinelesbar ist, weil es gut für hoch-strukturierte Daten einsetzbar ist und weil es flexibel ist, da die Tags nicht festgelegt sind. • Einige Standards weisen spezielle strukturelle Besonderheiten auf: Subfields, Indikatoren, externe und interne Sichten. • Es gibt eine Vielzahl von Standards je nach Einsatzzweck und/oder Typ der Ressource • Wenn man Standards kennenlernen möchte, bedient man sich der Standard- Dokumentationen Seite 48 Zusammenfassung: Metadatenstandards
  • 50. PPN Titel Verfasser Sonst. Beteil.Person Umfang ISBN Schlagwörter Fussnoten Verwandte Ressourcen URL Metadaten-Standard einer „Community“ / Domain, z.B. PICA, Dublin Core, DDI etc. DOI Tongeschlecht Epoche Bildformat Anzahl Pixel Primärkörperschaft Format URN Kompression Handle Regie Metadatenstandard und Metadatenschema Metadatenformat /-Schema einer bestimmten Anwendung, z.B. Repository für Publikationen Metadaten- Elemente einer realen Informations -einheit Titel: Verfasser: Sonst. Personen: Körperschaft: Erschienen: Umfang: Anmerkung: ISBN: Schlagwörter: URL: Seite 50
  • 51. Metadaten-Dokumentation für individuelle Anwendungen: Application Profiles “In DCMI usage, an application profile is a declaration of the metadata terms an organization, information resource, application, or user community uses in its metadata. In a broader sense, it includes the set of metadata elements, policies, and guidelines defined for a particular application or implementation. […] An application profile is not considered complete without documentation that defines the policies and best practices appropriate to the application.” (DCMI Glossary) Application Profile (AP): Metadaten-Profil, -schema einer bestimmten Anwendung, das Elemente aus einem oder mehreren Standards enthält Festlegung der • Elemente • Unterfelder/Refinements • Encoding Schemes • Wiederholbarkeit • Pflichtfelder Dokumentation der • Struktur • Richtlinien • Best Practice http://www.dlib.org/dlib/june06/chan/06chan.html Seite 51
  • 52. AP - Grundsätzliche Überlegungen Welchen Zweck hat die Anwendung? • Verwaltung von Daten für den “Hausgebrauch”? • Organisations-übergreifender Datenaustausch? • Integration der Daten in Webdienste? • … Welche Funktionen soll die Anwendung unterstützten? • Erweiterte Suche? • Browsing? • Facetten? • … Was für Objekte werden beschrieben? • Text, Personen, Filme …? • … Welche Beziehungen gibt es zwischen den Objekten? • Ist Urheber von … • Ist Teil von … • … Was brauche ich, um meine Ziele und Anforderungen umzusetzen? • Welche Metadatenterme? • Was für Encoding Schemas? • Was für Einschränkungen? Seite 52
  • 53. Praxis – Kriterien für die Formatauswahl Erst prüfen • Gibt es für meine Anwendung bereits einen Standard? • Welcher Standard wird in meiner Community genutzt? • Welcher Standard passt zu meiner Anwendung / in meinem Kontext? • Welcher Standard entspricht am ehesten meinen Anforderungen? – “Use elements and qualifiers to meet the needs of your local context, but ... – remember that your metadata may be interpreted by machines and people, so ... – consider whether the values you use will aid discovery outside your local context.“ Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf) Seite 53Metadata Madness wheel, Musebrarian, http://www.flickr.com/photos/musebrarian/3289649684/
  • 54. Praxis – Kriterien für die Auswahl des/der Standard(s) – “Use elements and qualifiers to meet the needs of your local context, but ... – remember that your metadata may be interpreted by machines and people, so ... – consider whether the values you use will aid discovery outside your local context.“ Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf) Daran denken • Auswahlkriterien: Anforderungen und Nachnutzbarkeit der Anwendung • Dokumentation ist wichtig • Verletze niemals die semantischen Grenzen eines Standards Ja! zur semantischen Verfeinerung Nein! zur semantischen Erweiterung Seite 54
  • 55. dcterms.creator Application Profile - Namensräume  DCMI namespace: "a collection of DCMI terms URIs“ (DCMI term URI: "The URI that identifies a term..“) „The purpose of an application profile is to adapt or combine existing schemas into a package that is tailored to the functional requirements of a particular application, while retaining interoperability with the original base schemas.“ Weibel, S. et.al. (2002) 55 dc.creator Seite 55
  • 56. Application Profile - Namensräume  Namensräume: können für spezifische Anwendungen definiert werden  Die Deklaration von Namensräumen erlaubt Designern von Metadaten-Schemas den Kontext, in dem ein bestimmtes Element verwendet wird, genau zu benennen und sichert zu, dass dieses Element im Namensraum eindeutig ist. dc dc.titel dc.creator dc.subject dc.description dcterms dcterms.dateIssued dcterms.abstract dcterms.coverage dcterms.spatial vascoda vap.placeOfPublication vap.edition vap.thematic vap.ddc meinAP dc.titel dc.creator dc.Subject dcterms.dateIssued dcterms.abstract dcterms.coverage vap.placeOfPublication vap.edition vap.thematic vap.ddc Namensräume Namespace Policy for the Dublin Core Metadata Initiative (DCMI) http://www.dublincore.org/documents/dcmi-namespace/ Seite 56
  • 57. Application-Profile - Singapore Framework „...a framework for designing metadata applications for maximum interoperability and for documenting such applications for maximum reusability.“ (http://dublincore.org/architecturewiki/SingaporeFramework/) • Das Singapore Framework für Dublin-Core-Anwendungsprofile nennt die Rahmenbedingungen um Metadatenanwendungen möglichst interoperabel zu gestalten und so zu dokumentieren, dass sie nachnutzbar sind. • Es definiert die Komponenten, die erforderlich und hilfreich sind, um ein Anwendungsprofil (Application Profile) zu dokumentieren. • Das Singapore Framework ist die Grundlage für die Beurteilung von Anwendungsprofilen in Hinblick auf Vollständigkeit der Dokumentation und auf Übereinstimmung mit den Prinzipien der Web-Architektur. Seite 57
  • 58. Application Profiles - Singapore Framework http://www.dublincore.org/documents/singapore-framework/ http://www.kim-forum.org/Subsites/kim/SharedDocs/Downloads/DE/Uebersetzungen/singaporeFramework.pdf?__blob=publicationFile (deutsch) • Funktionale Anforderungen (verpflichtend) • Domain-Modell (verpflichtend) • Beschreibungssatz-Profil (verpflichtend) • Nutzungsrichtlinien (fakultativ) • Richtlinien für die syntaktische Kodierung (fakultativ) Seite 58
  • 59. Zusammenfassung: Application Profile • Metadatenschemas, bzw. -profile bestehen aus Elementen aus einem oder mehreren Metadatenstandards • Ein Applikation Profile ist die Festlegung der einsetzbaren Elemente und deren Bedingungen (Encoding Schemes, Wiederholbarkeit, Verpflichtung, etc.) sowie der zu nutzenden Richtlinien. • Grundsätzliche Überlegungen: Zweck der Anwendung, Funktionen der Anwendung, beschriebene Objekte und Beziehungen zwischen Ihnen. • Man sollte eingeführte Standards nachnutzen und kann auch mehrere Standards kombinieren. • Um Elemente aus verschiedenen Standards eindeutig benennen zu können werden Namenräume (namespaces) verwendet. • Eine Handreichung zur Erstellung optimaler Application Profiles bietet das Singapore Framework der DCMI. Seite 59
  • 60. Application Profile „The main goal of application profiles is to increase the "semantic interoperability" of the resulting metadata instances within a community of practice, by going beyond the universal consensus of a single standard, without compromising the basic interoperability that the standard enables across the boundaries of these communities.“ [Special section on semantic interoperability in global information systems, ACM SIGMOD Record, Vol. 28, No. 1, March 1999.] Seite 60
  • 61. Interoperabilität Interoperabilität ist die Fähigkeit unterschiedlicher Informationssysteme miteinander zu kommunizieren und so Metadaten möglichst effizient und sinnvoll und mit einem minimalen Verlust an Information auszutauschen.  systemübergreifender Austausch von Metadaten unter möglichst geringem Aufwand. Problem: Austausch oder Integration von Daten, die in verschiedenen Standards vorliegen Seite 61
  • 62. 62 Interoperabilität Strukturelle Interoperabilität • gegeben, wenn unterschiedlichen Metadatenschemas ein gemeinsa- mes Datenmodell zugrunde liegt (z. B. DCMI Abstract Model, FRBR). Syntaktische Interoperabilität • gegeben, wenn unterschiedliche Metadaten-Schemas in einer gemeinsamen Kodierungssyntax (z. B. XML, RDF) wiedergegeben werden. Semantische Interoperabilität • gegeben, wenn unterschiedliche Metadatenschemas ein gemeinsames Vokabular (Metadatenstandard) verwenden Seite 62
  • 63. Interoperabilität - Übung 001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/49 $b49 101B $004-03-09$t09:15:56.000 Pica+ MODS Seite 63 Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht interoperabel?
  • 64. Interoperabilität - Lösung 001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/49 $b49 101B $004-03-09$t09:15:56.000 Pica+ (text) MODS (xml) Seite 64 Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht interoperabel?
  • 66. Was bedeutet „Mapping“? Aufgabe: Integration heterogener Metadaten in einem System: EconBiz Dublin Core (XML) PICA 3 Titel=4000 Titel=<title> • Metadaten verschiedener Provenienz, die in verschiedenen Formaten vorliegen • Mittels Suchmaschine-Technologie unter einer Oberfläche durchsuchen • Verfeinerung per Drill-Down Seite 66
  • 67. • „Übersetzen“ der Elemente und Regeln von einem Standard (Schema / Format) in einen anderen • Mapping: die sich entsprechenden Bestandteile zweier unterschiedlicher Metadaten-Standards oder -schemata miteinander in Beziehung setzen samt Regeln • Metadata "mapping" refers to a formal identification of equivalent or nearly equivalent metadata elements or groups of metadata elements from different metadata schemas, carried out in order to facilitate semantic interoperability (Getty Glossary) Element DB2 – MAB (Ziel) DB1 – PICA (Quelle) Anmerkungen Bezeichner Syntax Bezeichner Syntax Anweisung für Transformation Verfasser 100 Nachname, Vorname 3000 Vorname@Nachname Quell-Wert vor Klammeraffen in Zielformat mit Komma Leerzeichen hinter Quell-Wert nach Klammeraffen schreiben, […] […] Seite 67 Was bedeutet „Mapping“?
  • 68. Seite 68 Crosswalk “A table that maps the relationships and equivalencies between two or more metadata schemes. Crosswalks or metadata mapping support the ability of search engines to search effectively across heterogeneous databases”. http://dublincore.org/documents/usageguide/glossary.shtml#C
  • 69. Crosswalk A crosswalk ist "a mapping of the elements, semantics, and syntax from one metadata scheme to those of another„. (http://www.niso.org/publications/press/Understandin gMetadata.pdf ). Crosswalks sind laterale Mappings, d.h. sie sind Einbahnstrassen von einem Schema in das andere. Seite 69
  • 70. Einige Problemfelder beim Mappen: • Mapping zwischen zwei unterschiedlich mächtigen Standards / Schemas: fehlende Felder im Zielformat / mehr als ein Feld im Zielformat • Unterschiedliche Eigenschaften: Einige Felder können als obligatorisch (Pflichtfeld) und andere als optional deklariert werden. Das wiederholte Vorkommen eines Elements kann zulässig sein oder nicht (Wiederholfähigkeit). • Unterschiedliche Syntax der Felder (unterschiedliche syntax encoding schemes): (z.B. A: „Vorname“, „Nachname“ und B: „Name“ (Nachname, Vorname) und C: „Vorname@Nachname“) • Verschiedene terminologische Vokabulare (unterschiedliche vocabulary encoding schemes): Werden unterschiedliche Vokabulare (z.B. Klassifikationen) verwendet müssen, diese ebenfalls „übersetzt“ werden (Cross-Konkordanz). Mapping in der Praxis - Problemfelder Seite 70
  • 71. Mapping in der Praxis In welcher Beziehung stehen die zu mappenden Elemente zueinander? Grad der strukturellen Übereinstimmung: • 1:1 one-to-one • 1:n one-to-many • n:1 many-to-one • 1:0 one-to-none Grad der semantischen Übereinstimmung: • = äquivalent • > Oberbegriff • < Unterbegriff • ≈ Seite 71
  • 72. Mapping in der Praxis = "is the same as„ Semantik des Quell- und des Zielformats stimmen überein.  Einfaches Element-to-Element-Mapping (Aber: Encoding Scheme beachten!) <dcterms:abstract> DC-Definition: A summary of the resource <mods:abstract> MODS-Def.: a summary of the content of the resource Quelle Ziel Seite 72 <dc:language>Deutsch</dc:language> <mods:languageTerm type= "code" authority="iso639-2b"> ger</mods:languageTerm>
  • 73. < Quell-Element ist „Unterbegriff“ des Zielelements Semantik des Quellelements ist enger gefasst, als die des möglichen Zielelements. Quelle Ziel <mods:relatedItem type=„isReferencedBy> </relatedItem> <dc:relation></dc:relation> DC-Definition: A related resource. MODS-Definition: Citations or references to published bibliographic descriptions, reviews, abstracts, or indexes of the content of the resource Mapping in der Praxis Seite 73
  • 74. Mapping in der Praxis > Quell-Element ist „Oberbegriff“ von Ziel-Element Semantik des Quellelements ist breiter gefasst, als die des Zielelements. <dc:subject> DC-Def.: „The topic of the resource.“ (nicht eingeschränkt; Geographika, Sachschlagwörter, Zeitschlagwörter etc.) <mods:subject> MODS-Def: "topic" is used as the tag for any topical subjects <mods:topic> that are not appropriate in the <geographic>, <temporal>, <titleInfo>, or <name> subelements  nicht zulässig! Quelle Ziel Seite 74
  • 75. Mapping in der Praxis Quellformat: MIX <Compression> <CompressionScheme>1</CompressionScheme> <CompressionLevel>10</CompressionLevel> </Compression> Zielformat: Dublin Core: ? nicht möglich Informationsverlust! http://commons.wikimedia.org/wiki/File:Rotten_apple.jpg Seite 75 1:0 Im Zielstandard gibt es kein Feld, das mit der Semantik des Quellelements übereinstimmt.
  • 76. Mapping in der Praxis 1:n Quell-Element muss auf zwei oder mehrere Ziel-Elemente verteilt werden / Nur Teil eines Quellelements kann auf Ziel-Element gemappt werden <gils:ContactName> The name of the person acting as contact for the information resource. <name type="personal"> <namePart type="given"></namePart> <namePart type="family"></namePart> </name> Transformationsregel angeben: anhand Syntax der Werte nach möglichen Trennzeichen (Steuerzeichen) suchen http://commons.wikimedia.org/wiki/File:Apfelteiler_fcm.jpg Seite 76
  • 77. n:1 Mehrere Quell-Elemente entsprechen Ziel-Element Nur zwei oder mehr verschiedene Informationen gemeinsam ergeben die Zielsemantik Mapping in der Praxis <part> <detail type="volume"> <number>24</number> Band </detail> <detail type="issue"> Heft <number>2</number> </detail> <extent unit="page"> Seitenangabe <start>23</start> <end>45</end> </extent> </part> <dc:bibliographicCitation> Definition: A bibliographic reference for the resource. Comment: Recommended practice is to include sufficient bibliographic detail to identify the resource as unambiguously as possible. Seite 77  Regel mit welchen Steuerzeichen die einzelnen Werte im Ziel-Element zusammen- gesetzt werden sollen http://commons.wikimedia.org/wiki/File:Fruit_salad_%281%29.jpg
  • 78. Mapping in der Praxis Wiederholbarkeit Quell-Element ist wiederholbar, Ziel-Element nicht Alle Werte des Quell-Elements in Ziel-Element mappen. Dabei Trennzeichen als Regel angeben Seite 78 Quell-Element ist nicht wiederholbar, Ziel-Element ist wiederholbar  Trennzeichen im Quell-Elements als Steuerzeichen für Zerlegung des Feldwerts nutzen dc:subject: Begriff1 dc:subject: Begriff2 dc:subject: Begriff3 <ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> Regel: alle Begriffe aus dc:subject in <ex:theme> mit Leerzeichen Semikolon Leerzeichen getrennt <ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> dc:subject: Begriff1 dc:subject: Begriff2 dc:subject: Begriff3 Regel: Trenne die Begriffe in <ex:theme> anhand Steuerzeichen (Leerzeichen Semikolon Leerzeichen)
  • 79. Mapping in der Praxis Verpflichtung Quell-Element ist Pflichtfeld, Ziel-Element nicht  Kein Problem Quell-Element ist nicht verpflichtend; Zielelement ist Pflichtfeld  Versuchen passende Werte aus einer Kombination von Quell- Elementen zu generieren. Wenn nicht möglich , Mapping nicht möglich. Seite 79
  • 80. Mapping in der Praxis Probleme mit den Daten: 1. Missing data: Werte sind nicht vorhanden 2. Incorrect data: Werte entsprechen nicht den Konventionen 3. Confusing data: unzulässige / fehlende Trennzeichen, eingebettete HTML-Tags 4. Insufficient data: fehlende Angabe welches kontrollierte Vokabular, Format etc. verwendet wird. Iterativer Prozess Daten- analyse Mapping Konver- tierung Kontrolle Seite 80
  • 81. Zusammenfassung: Mapping und Crosswalks • Beim Mappen wird semantische, syntaktische und strukturelle Interoperabilität hergestellt. • Voraussetzung für ein korrektes Mapping ist die klare und präzise Definition der Elemente in den jeweiligen Standards. • Das Mapping sollte das Erstellen von Transformationsregeln ermöglichen, mit denen sich die Daten aus dem einen Schema möglichst vollständig in das andere Schema überführen lassen. • Eigentliches Konvertieren der Daten mittels programmiertem Script • Mapping ist der erste Schritt zur Integration heterogener Daten in einem System Seite 81
  • 82. Mapping - Übung Seite 82 Quelle: MODS-Schema: Element language mit encoding scheme Soll nach PICA (GBV) gemappt werden! Aus der GBV- Katalogisierungsrichtlinie: <language> <languageTerm type="code" authority="iso639-1"> de </languageTerm> </language> Die Kategorie 1500 enthält Angaben zur Sprache des vorliegenden Textes in codierter Form. Die Codierungen erfolgen nach ISO 639-2, vgl. Anhang 2. Bei Neuaufnahmen im System ist die Angabe der Sprachbezeichnung verbindlich. Fragen: Was muss man beim Mapping beachten? Ist ein Mapping möglich?
  • 83. Mapping - Lösung Seite 83 Antwort: Ja, ein Mapping ist möglich: die Semantik der Felder in den beiden Schemas stimmen überein. Aber: das Vokabular muss „übersetzt“ werden. Anhand einer Konkordanz zwischen ISO 639-1 und ISO 639-2 müssen die Werte konvertiert werden. de  ger
  • 84. Zusammenfassung: Mapping und Crosswalks Seite 84 “A crosswalk is a specification for mapping one metadata standard to another. Crosswalks provide the ability to make the contents of elements defined in one metadata standard available to communities using related metadata standards. Unfortunately, the specification of a crosswalk is a difficult and error-prone task requiring in-depth knowledge and specialized expertise in the associated metadata standards. Obtaining the expertise to develop a crosswalk is particularly problematic because the metadata standards themselves are often developed independently, and specified differently using specialized terminology, methods and processes. Furthermore, maintaining the crosswalk as the metadata standards change becomes even more problematic due to the need to sustain a historical perspective and ongoing expertise in the associated standards.” http://www.niso.org/publications/white_papers/crosswalk/
  • 86. Schnittstellen Softwareschnittstellen / softwareseitige Datenschnittstellen : • definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und Komponenten ausgetauscht werden • Z39.50: • Netzwerkprotokoll, das • im Bibliothekswesen Standard zur Abfrage von bibliographischen Informationssystemen • Mit dem Zusammenführen der Daten hat die Bedeutung der Abfrage von verteilten Informationssystemen mit Z39.50 abgenommen • SRU: • Nachfolger von Z39.50 • HTTP-basierte Protokoll Search/Retrieve via URL (SRU/SRW), • Techniken basieren auf etablierten Internet-Standards wie URI und XML Seite 86
  • 87. 87 Linkresolver • System zur Verfügbarkeitsanzeige wissenschaftlicher Publikationen. • HTTP-basierter Service • Metadaten der Quelle (Source) + gespeicherte Informationen über lokale Bestände und Lizenzen • Links auf "passende" Dienste wie elektronische Volltexte, Dokumentenlieferdienste, den lokalen OPAC und den Buchhandel Link-Resolver http://www3.interscience.wiley.com/resolve/openurl? genre=article &issn=0022-2380 &volume=30 &issue=6 &spage=1017 OpenURL Seite 87
  • 88. openURL „The OpenURL is a protocol for interoperability between an information resource and a service component that offers localized services in an open linking environment. It is in effect an actionable URL that transports metadata or keys to access metadata for the object for which the OpenURL is provided. „ (http://www.oclc.org/research/projects/openurl/default.htm) • Standard ANSI/NISO Z39.88 • ANSI/NISO Z39.88 - The OpenURL Framework for Context-Sensitive Services • Pflege und Entwicklung OCLC • Key-Encoded Value Guidelines: http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html Seite 88
  • 89. openURL Standard für die Übermittlung von bibliographischen Metadaten (Context-Sensitive Linking) http://openurlgw.hbz-nrw.de/gw ?aulast=Clark &aufirst=Timothy &au=Wright%2C+Mike &atitle=So%2C+Farewell+Then+.+.+.+Reflections+on+Editing+the+Journal+of+M anagement+Studies &jtitle=Journal+of+management+studies+%3A+JMS &stitle=J.+Manage.+Stud.+(GB) &date=2009 &volume=46 &issue=1 &pages=1-9 &issn=00222380 &coden=JMASB2 &genre=article Seite 89
  • 90. OAI-PMH - OAI Protocol for Metadata Harvesting Open Archives Initiative (OAI): • Initiative von Betreibern von Dokumentenservern, um die abgelegten elektronischen Publikationen besser auffindbar und nutzbar zu machen • OAI Protocol for Metadata Harvesting (OAI-PMH) zum Einsammeln (Harversting) und Weiterverarbeiten von Metadaten • Metadaten werden von Data Providern bereitgestellt • Geharvestete Datensätze werden von Service Providern aufbereitet und bereitgestellt • kleinster gemeinsamer Nenner: Dublin-Core-Datenmodell • Erweiterung mit zusätzlichen Standards (z.B. MODS, MARC mittels MARCXML) empfohlen • http://www.openarchives.org/pmh/ Seite 90
  • 91. OAI-PMH - OAI Protocol for Metadata Harvesting OAI-Anfrage an EconStor http://www.econstor.eu/dspace-oai/request? verb=GetRecord&metadataPrefix=didl&identifier=oai:econstor.eu:10419/41393 Seite 91
  • 92. 92 OAI-PMH - OAI Protocol for Metadata Harvesting http://www.econstor.eu/dspace-oai/request? verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:econstor.eu:10419/41393 Seite 92
  • 93. 93 OAI-PMH - OAI Protocol for Metadata Harvesting 6 verbs um ein Repository abzufragen: • GetRecord: individuellen Datensatz abfragen • Identify: Information über Repository abfragen • ListRecords: um Datensätze zu harvesten • ListIdentifiers: Abkürzung von ListRecords: man bekommt nur header; nicht Datensätze • ListMetadataFormats: die zur Verfügung stehen Metadatenformate abfragen • ListSets: Kollektionen eines Repositorys abfragen Seite 93
  • 94. OAI-Explorer Schnittstelle um Repositories interaktiv auf ihre Übereinstimmung mit dem OAI- PMH zu testen. http://re.cs.uct.ac.za/ Seite 94
  • 96. COinS (ContextObjects in Spans) • Methode zur Einbindung von bibliographischen Metadaten in HTML-Seiten • Basiert auf OpenURL • Browser-Plugins / weitere Programme können aus den „unsichtbaren“ COinS im Quelltext einer Webseite • OpenURL-Links für einen Linkresolver erzeugen • Metadaten auslesen (Literaturverwaltung) • Prinzip: Mikroformat Schnittstellen für Literaturverwaltung Seite 96
  • 97. Zusammenfassung: Schnittstellen Seite 97 • Schnittstellen definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und Komponenten ausgetauscht werden • Ein Linkresolver ist eine "Allround-Schnittstelle" zur Anzeige von Verfügbarkeits- informationen. • OpenURL nutzt für jedes Dokument einen abstrakten Namen, der durch einen Mechanismus zu einer URL aufgelöst wird (Actionable URL) • Key-Encoded-Values: einem Schlüssel (Element) wird ein Wert zugeordnet • OAI-PMH: OAI Protocol for Metadata Harvesting: Schnittstelle zum Harvesten von Metadaten von Dokumentenservern • Dublin-Core-Datenmodell • häufig zusätzliche Standards • Metadaten für die Literaturverwaltung: • RIS, BibTeX, EndNote, Mikroformat COinS
  • 98. 6. Metadaten für das Semantic Web Seite 98
  • 99. Metadaten für das Semantic Web Problem heutiger Suchmaschinen 1. Unpassende Suchergebnisse  Suchanfrage ist mehrdeutig (Homonymie / Polysemie) 2. Fehlende Suchergebnisse  Synonyme werden bei Suche nicht berücksichtigt z.B. Suche nach „Zukunftsforschung“ findet nicht „Futorologie“, „future studies“ Ursache • Mangel an expliziter Semantik Seite 99
  • 100. 100 Mikroformate: semantische Annotation • Formate zur »Feinstrukturierung« von Webseiten. • (X)HTML-Dokumente menschen- und maschinenlesbar mit Infos ergänzt • Mikroformate nutzen vorhandene XHTML-Attribute • Informationen lassen sich aus einer Website extrahieren und anderen Programmen zugänglich machen • Domain-spezifische Vokabulare: Termine, Kontaktinformationen, soziale Beziehungen. • http://microformats.org/ Seite 100 BEGIN:VCALENDAR VERSION:2.0 PRODID:http://www.example.com/calendarapplication/ METHOD:PUBLISH BEGIN:VEVENT UID:461092315540@example.com ORGANIZER;CN="Alice Balder, Example Inc.":MAILTO:alice@example.com LOCATION:Somewhere SUMMARY:Eine Kurzinfo DESCRIPTION:Beschreibung des Termines CLASS:PUBLIC DTSTART:20060910T220000Z DTEND:20060919T215900Z DTSTAMP:20060812T125900Z END:VEVENT END:VCALENDAR
  • 101. • Microdata erweiterte Microformats und überwindet deren Schwächen (z.B. unflexibel) • Ausdruckstärkere semantische Annotation von Webseiten • Specification: http://www.w3.org/TR/microdata/ • Attributerweiterung für HTML5: itemprop, itemref, itemtype, itemscope, .. Microdata: Schema.org Seite 101 • 2011: Initiative der Suchmaschinenbetreiber Google, Bing, Yahoo, Yandex: schema.org • “create and support a common set of schemas for structured data markup on web pages.” • Nutzen für Fachportal EconBiz: Verbesserte Verbreitung der Meta- daten
  • 102. Microdata: Schema.org Seite 102 Google Structured Data Testing Tool: http://www.google.com/webmasters/tools/richsnippets
  • 103. Semantic Web Tim Berners Lee (1998): Semantic Web Roadmap: “The web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help.” http://www.w3.org/DesignIssues/Semantic.html  Nur möglich, wenn die Information von Maschinen gelesen und interpretiert werden kann Heute: • Versuch die Bedeutung einer Information zu extrahieren • Fehleranfällig Semantic Web: • Web Content in natürlicher Sprache wird explizit mit semantischen Metadaten ausgezeichnet • Semantische Metadaten kodieren die Bedeutung des Inhalts in maschinen-interpretierbarer Art Seite 103 Tim Berners-Lee at Campus Party Brasil, 2009, http://commons.wikimedia.org/wiki/File%3ATim_Berners-Lee_CP.jpg
  • 104. Semantic Web Erweiterung des World Wide Web: Seite 104 „Im Web werden immer mehr veröffentlichte Daten in RDF (s.u.) vorliegen, d.h. sie folgen denselben Standards und können daher frei miteinander kombiniert und verlinkt werden. So entsteht das Semantic Web als eine verteilte Datenbank, die komplexe Abfragen und Schlussfolgerungen über dezentral vorliegende Daten ermöglicht.“ Linked Data und die Bibliothekswelt Adrian Pohl (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen) http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf
  • 105.  formale Sprache für die Bereitstellung von Metadaten im WWW  Umgesetzt werden diese Beschreibungen nach dem RDF-Modell entweder als Graph oder nach der RDF-Syntax als XML.  Eine Ressource (z.B. eine Monographie) wird durch eine bestimmte Eigenschaft (property) bzw. Relation beschrieben. Diese Eigenschaft kann einen bestimmten Wert annehmen. Das Kapital „Marx, Karl“ hatAutor Ressource Eigenschaft Wert RDF - Resource Description Framework Subjekt Prädikat Objekt http://d-nb.info/gnd/4099309-7 dc.creator „Marx, Karl“ http://d-nb.info/gnd/4099309-7 dc.creator http://d-nb.info/gnd/118578537  Subjekt muss URI (Uniform Resource Identifier) sein, Objekt kann eine weitere URI oder ein String (Zeichenkette) sein Seite 105 Tripel
  • 106. Ressource - URI - Repräsentation Seite 106 Repräsentation: Webseite über St. Michaelis http://dbpedia.org/resource/ St._Michaelis_Church,_Hamburg URI: Identifier für St. Michaelis Ressource: St. Michaelis http://commons.wikimedia.org/wiki/File:Michel_-_Noord.jpg • Uniform Resource Identifier (URI): Zeichenfolge, die zur Identifizierung einer abstrakten oder physischen Ressource dient • eindeutiger dauerhafter Identifikator einer Ressource
  • 107. Ressource - URI - Repräsentation Seite 107 « Ceci n'est pas une pipe »  « Das ist keine Pfeife » René Magritte: La trahison des images, 1928–29 Richtig! Das ist ein Bild einer Pfeife = Repräsentation
  • 108. Bedeutung für Beschreibung von Bibliotheksressourcen: verschiedene Metadatenstandards können in RDF integriert werden „The Resource Description Framework (RDF) of the World Wide Web Consortium (W3C) is another model that "provides a mechanism for integrating multiple metadata schemes" [NISO, 2004] for the description of Web resources. It is a data model that provides a framework within which independent communities can develop vocabularies that suit their specific needs and share vocabularies with other communities. It utilizes the XML namespace to effectively allow RDF statements to reference a particular RDF vocabulary or schema. „Zeng, M.L.; Chang, L.M. , http://www.dlib.org/dlib/june06/zeng/06zeng.html Beispiel DC-RDF: Die Ressource ‚http://ilrt.bristol.ac.uk/people/cmdjb/‘ hat den Titel ‚Dave Beckett´s Homepage‘ und hat den Autor ‚Dave Beckett‘, hat Herausgeber ‚ILRT; University of Bristol‘ und hat das Erstellungsdatum ‚31.7.2002‘ RDF - Resource Description Framework Seite 108
  • 109. 1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu: RDF - Resource Description Framework - Übung Seite 109 Subjekt Prädikat Objekt Harry Potter wird verlegt bei Carlsen 2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel (URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“) dc:date dc:creator dc:titledc:identifier dc:contibutor Eigenschaften ID: http://d-nb.info/990563480 Titel: Metadata for semantic and social applications Verfasser: Greenberg, Jane (http://d-nb.info/gnd/136971857) Jahr: 2008
  • 110. 1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu: RDF - Resource Description Framework - Lösung Seite 110 Subjekt Prädikat Objekt Harry Potter wird verlegt bei Carlsen http://d-nb.info/990563480 http://d-nb.info/990563480 http://d-nb.info/990563480 http://d-nb.info/gnd/136971857 “Metadata for semantic and social applications” Greenberg, Jane ID: http://d-nb.info/990563480 Titel: Metadata for semantic and social applications Verfasser: Greenberg, Jane (http://d-nb.info/gnd/136971857) Jahr: 2008 dc:date dc:creator dc:title http://d-nb.info/990563480 „2008“ dc:creator 2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel (URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
  • 111. Meta-Modell: RDF-Schema Seite 111 http://d-nb.info/gnd/4099309-7 dc:creator „Marx, Karl“ dc:Bibliographic Resource dc:Agentdc:creator rdfs:class rdfs:classrdfs:property rdfs:class rdf:type rdf:type rdf:type rdf:typerdf:type rdfs:subClassOfrdfs:subClassOf rdfs:subClassOf domain range RDFS RDF
  • 112. 112 SKOS – Simple Knowledge Organisation System • formale Sprache zur Kodierung von Wissensorganisationssystemen wie Ontologien, Thesauri, Klassifikationen, Taxonomien, andere Arten von kontrolliertem Vokabular • baut auf dem Resource Description Framework (RDF) und RDF-Schema auf • skos:broader (Oberbegriffe) • skos:narrower (Unterbergiffe) • skos:related (verwandte Begriffe) • … Seite 112
  • 113. Web of Linked Data RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für Entitäten = Web of Data Cool URIs don't change What makes a cool URI? A cool URI is one which does not change. What sorts of URI change? URIs don't change: people change them. http://www.w3.org/Provider/Style/URI Seite 113 Semantic Web Stack http://commons.wikimedia.org/wiki/File:Semantic_Web_Stack.png
  • 114. 114 Daten für das Semantic Web veröffentlichen: Linked (Open) Data Grundsätze von Linked Data 1. Verwende URIs als Name für Objekte. 2. Verwende http-URIs, so dass andere den Namen nachschlagen können. 3. Wenn jemand einen Namen nachschlägt, stelle hilfreiche Informationen zur Verfügung und benutze Standards (RDF, SPARQL). 4. Stelle Links zu anderen URIs bereit, so das man Weiteres entdecken kann. On the Web Machine-readable data Non-proprietary format RDF standards Linked RDF Linked Open Data (LOD) ist Linked Data, welche unter einer offenen Lizenz veröffentlicht wird, die eine freie Nachnutzung nicht behindert. 5 Stars of Linked Open Data: Seite 114
  • 115. Web of Linked Data Seite 115 2007 2009 2011
  • 116. Linked Data in Bibliotheken Seite 116 Warum? • Sichtbarkeit im Web maximieren • Bestände leichter auffindbar machen • Nachnutzbarkeit sicherstellen: insbesondere durch nichtbibliothekarische Domänen • Bibliographische Nachweise durch die Verknüpfung mit anderen Informationen anreichern • Recherchemöglichkeiten optimieren EconStor goes LOD
  • 117. Linked Data in Bibliotheken Bereitstellen und Nutzen von kontrollierten Vokabularen und Ontologien in RDF • DBPedia: • Projekt der Universität Leipzig, FU Berlin und OpenLink Software • strukturierte Informationen aus Wikipedia extrahieren und in RDF bereitstellen • Dreh- und Angelpunkt der Linked Data Cloud • http://dbpedia.org/ • Standard Thesaurus Wirtschaft: http://zbw.eu/beta/econ-ws/about • Gemeinsame Normdatei der Deutschen Nationalbibliothek: http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html • …. Bereitstellen und Nutzen von Titeldaten in RDF • hbz: http://lobid.org/about • B3Kat (BSB, KOBV): http://lod.b3kat.de/doc • … Seite 117
  • 118. Linked Data in Bibliotheken Bereitstellen von Tools • Culturegraph: Plattform für Dienste und Projekte rund um die Themen Datenvernetzung, Persistent Identifier und Linked Open Data für kulturelle Entitäten • http://www.culturegraph.org/ Internationalisierung der bibliothekarischen Regelwerke • Resource Description and Access (RDA) • Umsetzung geplant in D für 2015 • Format-unabhängig • Entwicklung ausgerichtet auf Nutzung im Semantic Web • FRBR- und RDA-Vokabular Seite 118
  • 119. 119 Metadata Registries • Identifikation existierender Elemente verschiedener Schemas und Application Profiles • Zur Nachnutzung und Konsultation bereitstellen • Ermöglichen automatische Anfragen von Anwendungen, die die URIs, die einem Schema enthalten sind, auflösen können. “The presence of a metadata registry application promotes the wider adoption, standardization and interoperability of metadata by facilitating its discovery, and reuse, across diverse disciplines and communities of practice" [Dublin Core Metadata Registry]. http://rdvocab.info/ Seite 119
  • 122. Zusammenfassung: Semantic Web • Semantic Web: das „verstehende Web“: Informationen werden auf der Ebene ihrer Bedeutung miteinander verknüpft. • Voraussetzung: • Maschinen-Interpretierbarkeit der Information  RDF • Eindeutigkeit eines Konzepts (einer Person, einer Körperschaft, eines Themas)  URI: Zeichenfolge, die zur dauerhaften Identifizierung einer abstrakten oder physischen Ressource dient • Vokabular zu Modellierung einer Ontologie: RDFS, OWL, SKOS • RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für Entitäten = Web of Data • Bibliotheken nutzen und veröffentlichen Linked Open Data • Recherche über Daten verschiedener Domänen • Verbessert Nachnutzbarkeit • Microformats und Microdata: „Semantic Web light“ Seite 122
  • 123. 7. Metadaten-Management in der ZBW Seite 123
  • 124. • Unterstützung beim Aufbau und Pflege der Informationssysteme des Informationszentrums • Koordination der Datenlieferungen • Hilfestellung in allen Fragen zu Metadaten- Formaten und Standards Metadaten-Management in der ZBW Querschnittsaufgabe Metadaten-Management Seite 124
  • 125. • Mitarbeit in Abteilungs-übergreifende Teams der ZBW • Mitarbeit in Drittmittel-Projekten • Enge Zusammenarbeit mit der Abteilung „Innovative Informations- systeme & Publikationstechnologien“ • Mitarbeit in Kooperation und (internationalen) Arbeitgruppen Metadaten-Management in der ZBW Metadaten-Management Seite 125
  • 126. Aufgaben des Metadaten-Managements Metadatenstandards und Mapping • Expertise bzgl. Metadaten-Standards und Regelwerken • Erarbeiten von Crosswalks Entwicklung und Weiterentwicklung von Metadatenformaten Neue Systeme: • Auswahl geeigneter Metadatenstandards gemäß der Anforderungen an das System, Ggf. Kombination mehrerer Standards • Entwicklung eines interoperablen Schemas • Erstellung von Application Profiles (Dokumentation) Bestehende Systeme, Z.B. EconStor, da|ra: • Kontinuierliche Weiterentwicklung angepasst an sich wandelnde Anforderungen Seite 126
  • 127. Koordination von Datenlieferungen Weitere Aufgaben des Metadaten-Managements • Bereitstellung / Auswertung von Testdaten und Dokumentationen • Dokumentation von eingehend und ausgehenden Datenlieferungen • Ansprechpartnerin für alle Fragen bzgl. Metadatenformat, Katalogisierung und Bereitstellung Seite 127
  • 128. Qualitätsmanagement und Weiteres Weitere Aufgaben des Metadaten-Managements • Mitarbeit System-Entwicklung: Funktionen, die auf Metadaten aufbauen, z.B. „Ähnliche Titel“, Merkliste, Exporte in Literaturverwaltungsprogramme • Weitere Fragestellungen: • Heterogene Sacherschließung in EconBiz • Dublettenproblematik: Wie erkennen wir Dubletten? • Qualitätsmanagement: • Erstellen von Statistiken • Datenanalysen: z. B. Prüfung einzelner Kategorien auf zulässige Inhalte • Datenanalysen: z.B. Stand der Normierung: hohe Bedeutung für das Zusammenführen von Beständen mit gleichen Merkmalen und Zukunftsfähigkeit der Metadaten Seite 128
  • 129. Anforderungen an Metadaten-Managerinnen und - Manager bibliothekarische Metadatenstandards Regelwerke und Frameworks Vokabulare und Normen Normdateien RAK-WB Seite 129
  • 130. • Analytisches Denken • Spaß daran, sich ständig mit neuen Aufgaben (Standards, Technologien) zu beschäftigen und weiterzubilden Methoden Best Practices Auszeichnungs- sprachen Technologien Hochspezialisierter Arbeitsbereich im Bibliothekswesen Anforderungen an Metadaten-Managerinnen und - Manager Seite 130
  • 131. 8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft Seite 131
  • 132. I LOVE META DATA • Querschnittsaufgabe • Kooperationen und Projekte • Hoch-spezialisierter Arbeitsbereich • Wissenschaftliche Bibliotheken: Zentrale Fachbibliotheken, Universitäts- bibliotheken, Nationalbibliotheken, Verbundzentrale • One-Person-Librarians „Metadaten-Management? Wer muss das wissen?“ Bibliothek der Zukunft Seite 132 l Verweisung vom zweiten Bestandteil des zusammengesetzten Namens (§ 319) Ist nach den Regeln ein zusammengesetzter Name in der Ordnungsgruppe des Familiennamens anzusetzen, so wird vom zweiten und von allen weiteren Hauptbestandteilen des zusammengesetzten Namens verwiesen. Die bei der Verweisung übergangenen Teile des zusammengesetzten Namens werden an das Ende der Ordnungsgruppe der Vornamen gestellt (319,1). l RAK
  • 133. Seite 133 Ausbildungsinhalte (2011/2012), untersucht v. A. Schafrick Bibliothek der Zukunft Metadatenstandards 4 1 4 4 2 1 2 1 1 0 0 1 1 1 1 0 3 1 0 0 0 1 1 1 1 0 0 0 0 1 2 3 4 5 6 7 Nicht spezifizierte bibliothekarische Metadatenformate PICA + PICA3 MAB2 MAB MABxml Marc21 ISBD DC TEI VRA ISAD G EAD Nicht spezifizierte archivarische Metadatenformate Wahlpflichtmodul Pflichtmodul Auswertung der Inhalte aus den jeweils aktuellsten öffentlich zugänglichen Modulhandbüchern der grundständigen Studiengänge in Deutschland im Bereich Bibliothekswesen mit dem Bildungsziel Bachelor of Arts (7 Hochschulen). Ergänzt um Inhalte aus den Vorlesungsverzeichnissen WS 2011/2012 und SS 2012. 3 1 3 4 3 7 1 2 1 1 2 1 2 1 2 0 1 0 1 0 0 0 0 1 2 3 4 5 6 7 Forschungsdatenmanagement Semantic Web (Linked Data, Vokabulare, semantische Persistent Identifer (Systembeispiele, Aufgaben) Digitale Langzeitarchivierung (Archivierungsformate, ...) Normierte Datenübergabe und - integration in verteilten Systemen Datenmodellierung/Datenmodelle Aktuelle Entwicklungen bei Standards zum Datenaustauch Kommunikationsprotokolle (OAH PMH, Z39.50) Crosskonkordanzen, Terminologie Mapping Metdata-Crosswalks Unterschiede Austauschformat, Internformat … Wahlpflichtmodul Pflichtmodul Seite 133 „Woher soll ich das wissen?“
  • 134. Seite 134 „Metadaten-Management? Chancen?“ Bibliothek der Zukunft Stellenanzeigen für Bibliothekarinnen und -Bibliothekare (Dipl. und B.A.) in Bibliotheken des spezialisierten und hochspezialisierten im deutschsprachigen Bereich vom 01.11.2011-30.04.2012 aus inetbib und Bibliojobs Seite 134
  • 135. Automatisierung • Automatische Indexierung und Klassifizierung • Automatische Strukturerkennung von elektronischen Dokumenten • Automatische Formalerschließung von elektronischen Dokumenten • Schließen von Lücken bei Formal- und Sacherschließung • Ergebnisse reichen derzeit nicht an intellektuelle Ergebnisse heran • Semi-automatische Verfahren • „Automatische Verfahren funktionieren nicht automatisch“  Entwickeln und Betreuen von automatischen Verfahren „In der Bibliothek arbeiten bald nur noch Informatiker“ Bibliothek der Zukunft Seite 135
  • 136. Seite 136 „Wer geht denn in die Bibliothek? Ist doch alles im Internet“ Bibliothek der Zukunft Seite 136 „Zur Bibliothek“, bmgnrs, http://www.flickr.com/photos/gigl/4807897633/ http://www.wer-weiss-was.de/theme199/article7098730.html
  • 137. Buchlose Bibliothek wächst und gedeiht Bibliothek der Zukunft Seite 137
  • 138. What is our role? Bibliothek der Zukunft http://thinklinks.files.wordpress.com/2013/03/ beyondthepdf2_day1_hires.jpg Metadaten: • (semi-)automatisch erstellte Metadaten • Metadaten für das Semantic Web • RDF, RDFS • OWL • SKOS • Ontologien statt Schlagwortlisten • Modellierung Seite 138
  • 139. What is our role? Bibliothek der Zukunft http://thinklinks.files.wordpress.com/2013/03/ beyondthepdf2_day1_hires.jpg Forschungsdaten: • Mitarbeit bei der Entwicklung von Forschungsumgebungen • Entwicklung von Publikationsplattformen • Unterstützung / Beratung der Forscher • Langzeitarchivierung, Dokumentation und Verbreitung • ganz praktisch: z.B. Normierung von Entitäten • Data Librarian: unterstützt bei Recherche nach FD und bei der Erstellung von Metadaten Seite 139
  • 140. What is our role? Bibliothek der Zukunft http://thinklinks.files.wordpress.com/2013/03/ beyondthepdf2_day1_hires.jpg Informationssysteme: • Integration von Metadaten aus verschiedenen Domänen: Bibliotheken, Museen, Archive, …, Internet • Erleichterte Verfügbarkeit für elektronische Dokumente (Rechtemanagement) • Dienst dort bereitstellen, wo die Nutzer sind: von Facebook bis Forschungsumgebung Seite 140
  • 141. What is our role? Bibliothek der Zukunft Seite 141
  • 142. Auf Du und Du mit Dublin Core & Co. k.jeude@zbw.eu „Metadata is a love note to the future”, Cea., https://secure.flickr.com/photos/centralasian/8071729256/in/photostream/ Seite 142
  • 143. Seite 143 Literatur Seite 143 Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997 http://www.w3.org/DesignIssues/ Brand, A., Daly, F., Meyers, B., & National Information Standards Organization (U.S.)(2003):Metadata demystified: A guide for publishers. Bethesda, Md: NISO Press. (www.niso.org/standards/resources/Metadata_Demystified.pdf ) Caplan, Priscilla: Metadata Fundamentals for All Librarians. Chicago, 2003, ALA Editions Dublin Core Metadata Initiative: DCMI Glossary. http://dublincore.org/documents/usageguide/glossary.shtml Foulonneau, Muriel; Riley, Jenn (2008): Metadata for digital resources: implementation, systems design and interoperability. Oxford: Chandos. Greenberg, J. (2008): Dublin Core History and Basics. Tutorial ASIST DC 2008 http://dc2008.de/wp- content/uploads/2008/09/tutorial-1.pdf Harper, Corey (2010): Dublin Core Metadata Initiative: Beyond the Element Set – NISO Information Standards Quarterly, v.22, no. 1, Winter 2010. http://www.niso.org/publications/isq/2010/v22no1 Hillman, D. I., & Westbrooks, E. L. (2004). Metadata in Practice. Chicago: ALA Editions. In Baca, M., & Getty Research Institute. (2008). Introduction to metadata. Los Angeles (Calif.: Getty Research Institute. Miller, Eric (1998): An introduction to the resource description framework. In: D-Lib Magazine, Volume 4 Issue 5, May 1998. http://www.dlib.org/dlib/may98/miller/05miller.html Mitchell, Nicole: Metadata Basics (2066): In: The Southeastern Librarian, Vol. 54: Iss. 3, Article 6 . http://digitalcommons.kennesaw.edu/seln/vol54/iss3/6/
  • 144. Literatur National Information Standards Organization (U.S.). (2004): Understanding metadata. Bethesda, MD: NISO Press. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf ) Pohl, Adrian (2011): Linked Data und die Bibliothekswelt. Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen). http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked- data_ODOK.pdf Riley, Jenn (2008-2010): Seeing Standards: A Visualization of the Metadata Universe. http://www.dlib.indiana.edu/~jenlrile/metadatamap Söllner, Konstanze (2008):„Academic Librarian of the Future“-Woher kommen die Spezialisten für die neuen Aufgaben in den Bibliotheken?. 102. Deutscher Bibliothekartag <Leipzig, 2013> http://nbn- resolving.de/urn:nbn:de:0290-opus-14644 St. Pierre, Margaret; LaPlant, William P. (1998): Issues in Crosswalking Content Metadata Standards.(NISO White Papers). Bethesda, MD: NISO. http://www.niso.org/publications/white_papers/crosswalk/ Weibel, S. et.al. (2002): Metadata Principles and Practicalities. In: D-Lib-Magazin, Vol. 8, No. 4, April 2002 Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part I: Achieving Interoperability at the Schema Level. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006. http://www.dlib.org/dlib/june06/chan/06chan.html Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part II: Achieving Interoperability at the Record and Repository Levels. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006. http://www.dlib.org/dlib/june06/zeng/06zeng.html Zeng, Marcia Lei, Jian Qin (2008): Metadata. New York: Neal-Schuman Publishers. Seite 144
  • 145. Webressourcen K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/ Blogs Metadata Matters: Bloggerin: Diane Hillmann: http://managemetadata.com/blog/ Coyle's InFormation: Bloggerin: Karen Coyle: http://kcoyle.blogspot.de/ Managing Metadata: Bloggerin: Laura Smart: http://library.caltech.edu/laura/ Metadata Discussion Group (Indiana University Libraries): https://blogs.libraries.iub.edu/metadata/ Fachjournale Journal of library metadata. 2008. New York, NY: Haworth Press. http://www.informaworld.com/smpp/title~db=all~content=t792306902 . D-Lib-Magazin (frei): http://www.dlib.org/ Seite 145
  • 146. Webressourcen Fortbildung K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/ Hyperlinked Library MOOC: http://slisweb.sjsu.edu/about-slis/news/detail/free- online-course-extends-learning-individuals-across-globe OpenHPI: (Hasso-Plattner-Institut für Informatik) https://openhpi.de/ Tools Dublin Core Tools zur Erstellung / Bearbeitung: http://www.dublincore.org/tools/ Marc-Tools, wie z.B. MarcEdit: http://www.loc.gov/marc/marctools.html Notepad++: Freier Text-Editor für große Dateien. Suchen und Ersetzen mit regulären Ausdrücken möglich Firefox-AddOns: Dublin Core Viewer, Operator (Mikroformaterkennung) Chrome-AddOn: Schema Explorer (Mikrodata), OpenLink Data Explorer Seite 146
  • 147. Metadatenstandards • Dublin Core: www.dublincore.org • Pica3/Pica+: (Katalogisierungsrichtlinie des Gemeinsamen Bibliotheksverbunds): http://www.gbv.de/vgm/info/mitglieder/02Verbund/01Erschliessung/02Richtlinien/01 KatRicht/inhalt.shtml • MARC21: http://www.loc.gov/marc/ • MODS: http://www.loc.gov/standards/mods/ • METS: http://www.loc.gov/standards/mets/ • Library of Congress Standards: http://www.loc.gov/standards/ • ONIX: http://www.editeur.org/83/Overview/ • TEI: http://www.tei-c.org/index.xml • DDI: http://www.ddialliance.org/ • BibTeX: http://www.bibtex.org/ • RIS: http://www.refman.com/support/risformat_intro.asp • COinS (KEV): http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html Seite 147