11. “A focused collection of digital
objects, including text, video,
and audio [and beyond: 3D
objects, simulations, dynamic
visualizations, and virtual
reality], along with methods for
access and retrieval, and for
selection, organization, and
maintenance of the collection.”
[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
Digitale Bibliothek
12. Sammlung digitaler Objekte
Text
Video
Audio
3D Objekte
Simulationen, VR, etc.
Bereitstellung von Zugriffsmöglichkeiten:
Benutzerseite:
Zugriff (access)
Abfrage (retrieval) von digitalen Objekten
Bibliothekarinnen-/Bibliothekarseite:
Selection
Organization
Maintenance
Metadaten Kritisch für alle Formen organisierter digitaler Inhalte
Digitale Bibliothek
14. Grundfrage: Woher stammen die Metadaten?
Option I: Ein Mensch hat festgelegt, dass x Ein Mensch
betrachtet und analysiert das Dokument und weist einem
Metadatenelement einen bestimmten Wert zu.
Option II: Ein Computerprogramm hat x analysiert und bestimmt
Ein Algorithmus verarbeitet das Dokument und gibt einen Wert für
das Metadatenelement aus.
Metadaten
15. Arten von Metadaten:
Administrative metadata for managing resources, such as
rights information
Descriptive metadata for describing resources (Beispiel:
Zettel des Zettelkataloges)
Preservation metadata for describing resources, such as
recording preservation actions
Technical metadata related to low-level system information,
such as data formats and any data compression used
Usage metadata related to system use, such as tracking
user behavior
“End user’s view is only the tip of the iceberg:
Much of the metadata is not intended for public display”
Metadaten
“End user’s view is only the tip of the
iceberg: Much of the metadata is not
intended for public display”
16. Arten von Metadaten:
Administrative metadata for managing resources, such as rights
information
Descriptive metadata for describing resources (Beispiel: Zettel
des Zettelkataloges)
Preservation metadata for describing resources, such as
recording preservation actions
Technical metadata related to low-level system information, such
as data formats and any data compression used
Usage metadata related to system use, such as tracking user
behavior
“End user’s view is only the tip of the iceberg: Much
of the metadata is not intended for public display”
19. MARC: MAchine Readable Cataloging
Vorgestellt in den späten 1960er Jahren von Henriette Avram
(Library of Congress)
!Grundproblem/-intention: Migration von Zettelkatalogen zu
computerbasierter Repräsentation von Datensätzen (Records)
MARC-Datensätze gespeichert als Sammlung von Feldern in
einem „ziemlich komplexen Format“
[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
“Producing a MARC record for a particular publication is an
onerous undertaking that is governed by a detailed set of (highly
detailed) rules and guidelines called the Anglo-American
Cataloging Rules (AACR2R, 2R final revised 2nd edition).”
[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]
MARC
21. Variable Control Fields (00x)
Variable Data Fields
Numbers and Codes (0xx)
Main Entries (1xx)
Titles (2xx)
Edition, Imprint, etc. (2xx)
Physical Description, etc. (3xx)
Series Statements (4xx)
Notes (5xx)
[…]
Vgl. die Referenz unter
http://www.loc.gov/marc/bibliographic/ecbdhome.html
MARC Tags (die Spitze des Eisbergs)
27. Maschinelles Austauschformat für Bibliotheken
(MAB),
MAB 1970er, Deutsche Nationalbibliothek
MAB2 1990er
Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung)
Kleiner Exkurs: MAB und VD18
28. Intention: Digitalisierung und Erschließung der im
deutschen Sprachraum veröffentlichten Drucke des
18. Jahrhunderts
Kontext
VD18
VD 16 VD 17 VD 18
~100 000 erfasste
Titel
~255 000
Titel
Ziel: Mehr als
600 000 Titel
Förderzeitraum: 1969-
1999
Förderzeitraum:
Seit Juli 1996
Förderzeitraum:
Ab 2009
33. Benannt nach Dublin, Ohio, wo 1995 das erste
Treffen der Gruppe / Initiative veranstaltet wurde.
Dublin Core (DC): Satz von vordefinierten
Metadatenelementen, intendiert für
Nutzung durch Nicht-Spezialisten
die Beschreibung digitaler Ressourcen (i.e. Websites),
die häufig keinen eigenen MARC Katalog-Eintrag
erhalten würden
Verglichen (z.B.) mit MARC: Sehr einfach
Designziel: Allgemeinheit, Einfachheit
Dublin Core
34. Satz von 15 Elementen zur Beschreibung von Ressourcen:
Title
Creator
Subject
Description
Publisher
Contributor
Date
Type
Format
Identifier
Source
Language
Relation
Coverage
Rights
Alle Elemente sind optional und wiederholbar, die Reihenfolge ist
beliebig
Dublin Core
36. Elementübersicht: http://de.wikipedia.org/wiki/Dublin_Core
Vgl. auch: http://de.selfhtml.org/html/kopfdaten/meta.htm#dublin_core
Übungsaufgabe: Geben Sie die wesentlichen Charakteristika des
Werkes „Die Jungfrau züchtigt den Jesusknaben vor drei Zeugen“
(Max Ernst, 1926) mit Dublin Core wieder.
Dublin Core Übung
37. Stärke von Dublin Core: Einfachheit
Schwäche von Dublin Core: Einfachheit
Genügen 15 Elemente, um (digitale) Objekte adäquat
zu beschreiben?
Dublin Core
42. Zwei sich ergänzende internationale Formate zur
Kodierung von Metadaten und digitalen Objekten, die
aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.)
bestehen (vgl. http://www.gbv.de/wikis/cls/METS/MODS):
Metadata Encoding and Transmission Standard (METS)
Metadata Object Description Schema (MODS)
Heimat von METS: http://www.loc.gov/standards/mets/
METS: „Designed to permit the representation,
maintenance, and exchange of the increasingly
complex digital objects that make up digital libraries.
Library catalogs have for years used MARC records to
fulfill these functions for their materials. The METS
initiative aims to do the same for digital collections.”
METS / MODS
45. OAI: Beispiel für eine Schnittstelle zur
Kommunikation von (Meta-)Daten über das
Internet
Konzepte & Co.:
Data Provider Systeme, die Metadaten über OAI-PMH
zugänglich machen
OAI-PMH OAI Protocol for Metadata Harvesting
Service Provider Sammelt Metadaten von
Datenprovidern, bietet Suchinterface für Archive, von
denen Metadaten gesammelt wurden
OAI: Begrifflichkeiten, Konzepte
46. Datenkommunikation über http-Request
Basisadresse + Script (+ Verb (+ Argument)?)*
Sechs "Verben" zur Kommunikation
Identify [wer bist du?]
ListMetadataFormats [was sprichst du?]
ListSets [was hast du für Sammlungen?]
ListIdentifiers [gib mir deine Identifier]
ListRecords [gib mir Datensätze]
GetRecords [gib mir Datensätze]
Sechs "Argumente":
metadataPrefix, identifier, from, until, set,
resumptionToken
OAI: Kommunikation
48. Arten von Metadaten:
Administrative metadata for managing resources, such as
rights information
Descriptive metadata for describing resources (Beispiel:
Zettel des Zettelkataloges)
Preservation metadata for describing resources, such as
recording preservation actions
Technical metadata related to low-level system information,
such as data formats and any data compression used
Usage metadata related to system use, such as tracking
user behavior
“End user’s view is only the tip of the iceberg:
Much of the metadata is not intended for public display”
Metadaten
“End user’s view is only the tip of the
iceberg: Much of the metadata is not
intended for public display”
März 2009
Hauptbestände (einschließlich der Codices der Sammlung Wallraf, also der mittelalterlichen Handschriftenabteilung).
90 Prozent der Archivalien verschüttet
Erstversorgungszentrum
Ende November 2012 online, möchte ~30.000 deutsche Kultur- und Wissenschaftseinrichtungen vernetzen und digitale Objekte über eigene Plattform zugänglich machen
Eigene Angaben: 5,6 Millionen Objekte
Ende November 2012 online, möchte ~30.000 deutsche Kultur- und Wissenschaftseinrichtungen vernetzen und digitale Objekte über eigene Plattform zugänglich machen
Eigene Angaben: 5,6 Millionen Objekte
Ende November 2012 online, möchte ~30.000 deutsche Kultur- und Wissenschaftseinrichtungen vernetzen und digitale Objekte über eigene Plattform zugänglich machen
Eigene Angaben: 5,6 Millionen Objekte
Gemeinsamer Bibliotheksverbund (Bundesländer Niedersachsen, Sachsen-Anhalt, Thüringen, Hamburg, Bremen, Schleswig-Holstein und Mecklenburg-Vorpommern)