Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC
Wie lassen sich fachspezifische Instrumente der bibliothekarischen und dokumentarischen Inhaltserschließung in sowohl national als auch vor allem stärker international sichtbare Erschließungssysteme einbinden? Dieser Frage widmet sich eine Kooperation zwischen Deutscher Nationalbibliothek (DNB) und GESIS - Leibniz-Institut für Sozialwissenschaften zur Erstellung und Evaluation von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften (KlassSoz) und der Dewey Decimal Classification (DDC), deren Ergebnisse im Rahmen des BID-Kongresses vorgestellt werden sollen.
Crosskonkordanzen dienen der Behandlung semantischer Heterogenität, indem Verbindungen zwischen semantischen Einheiten unterschiedlicher Erschließungssysteme erstellt und diese Relationen qualifiziert werden. Hierdurch wird die einheitliche Suche über verteilte und heterogen erschlossene Informationsangebote - auch über unterschiedliche Dokument- und Datentypen hinweg - möglich: aus einer Ein-Datenbank-Suche wird ein verteiltes Suchszenario. Gleichzeitig erfolgt die enge Anbindung eines lokal verwendeten Indexierungsinstruments an ein international etabliertes Erschließungssystem.
Der Vortrag liefert einen Überblick über die Methodik zur Erstellung, Qualifizierung und Evaluation der Relationen. Anhand exemplarischer Falldarstellungen wird das genaue Vorgehen beim Mapping illustriert. Zusätzlich wird auf die Überführung der Crosskonkordanzen in das SKOS-Format und damit die Bereitstellung der Mappings als Linked Data im Semantic Web eingegangen. Abschließend werden die Nutzungsmöglichkeiten der Mappings zur Wissensexploration skizziert.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Von der Ein-Datenbank-Suche zum verteilten Suchszenario: Zum Aufbau von Crosskonkordanzen zwischen der Fachklassifikation Sozialwissenschaften und der DDC
1. Von der Ein-Datenbank-Suche
zum verteilten Suchszenario
Zum Aufbau von Crosskonkordanzen zwischen
der Fachklassifikation Sozialwissenschaften
und der Dewey-Dezimalklassifikation
Dr. Andreas Oskar Kempf, M.A.(LIS)
Katrin Baum, Dipl.-Bibl.
GESIS – Leibniz-Institut für Sozialwissenschaften
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013
2. Gliederung
Definition und Nutzen von Crosskonkordanzen
Vorstellung der verwendeten Klassifikationssysteme
Klassifikation Sozialwissenschaften (KlassSoz)
Dewey-Dezimalklassifikation (DDC)
Zum Vorgehen beim Crosskonkordanz-Aufbau
Relations- und Relevanztypen
Einfache und mehrfache Relationen
Exemplarische Klassenabbildungen
Gesamtübersicht und Ausblick
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 2
3. Definition Crosskonkordanzen
Crosskonkordanzen bezeichnen im Kontext der
Inhaltserschließung Beziehungen zwischen
Konzepten unterschiedlicher
Erschließungssysteme (z.B.
Thesaurus, Klassifikation).
Die Beziehungen werden bilateral und somit
richtungsabhängig festgelegt.
(z.B. KlassSoz > DDC; DDC > KlassSoz).
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 3
5. Relationstypen
SKOS-Mapping-Relationen
skos:exactMatch-Relation (A=B):
Klasseninhalt Zielklassifikation (B) ist mit Klasseninhalt der
Ausgangsklassifikation (A) identisch
skos:broadMatch-Relation (A<B):
Klasseninhalt der Zielklassifikation (B) ist weiter gefasst als
der Klasseninhalt der Ausgangsklassifikation (A)
skos:narrowMatch-Relation (A>B):
Klasseninhalt der Zielklassifikation (B) ist enger gefasst als
der Klasseninhalt der Ausgangsklassifikation (A)
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 5
6. Relevanztypen
Hohe Relevanz für das Retrieval:
Klasseninhalt der Ausgangsklassifikation ist zentraler Klasseninhalt
der Zielklassifikation
Mittlere Relevanz für das Retrieval:
Klasseninhalt der Ausgangsklassifikation ist ein
nachrangiger, wenngleich nicht marginaler Bestandteil des
Klasseninhalts der Zielklassifikation
Geringe Relevanz für das Retrieval:
Klasseninhalt der Ausgangsklassifikation ist nur ein marginaler
Bestandteil des Klasseninhalts der Ausgangsklassifikation
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 6
7. Klassifikation Sozialwissenschaften (KlassSoz)
Fachklassifikation
in dieser Form seit 1996 für die
GESIS Literatur- und Projekt-
datenbank (SOLIS/SOFIS)
verwendet
159 Klassen (5 Haupt- und 154
Unterklassen)
3 Hierarchieebenen
Variable Anzahl an Unterklassen
Vergabepraxis:
1 Hauptnotation und variable
Anzahl an Nebennotationen
9. Dewey-Dezimalklassifikation (DDC)
Universalklassifikation
1873 von Melvil Dewey entwickelt und 1876 erstmals
veröffentlicht
wird in über 200.000 Bibliotheken in über 135 Länder
verwendet
in über 30 Sprachen übersetzt
seit 2005 auch von der DNB verwendet
ca. 27.000 Klassen in den Haupttafeln
ca. 9.500 Klassen in den Hilfstafeln
der Aufbau entspricht dem Dezimalsystem,
d.h. max. 10 Unterklassen
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 9
11. Crosskonkordanz-Aufbau
Einfache Relationen: für die Abbildung
der Klasseninhalte aufeinander wird
ausschließlich eine Relation verwendet
Mehrfache Relationen: für die Abbildung
der Klasseninhalte aufeinander werden
mehrere Relationen aufgebaut
(1:n-Relation, n:1-Relation)
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 11
12. Einfache Relationen (1/3)
Beispiel: skos:exactMatch-Relation
=: kongruente
Klasseninhalte
h: Klassen-
inhalt KlassSoz
deckt sich
sehr gut mit
DDC-Klasse
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 12
13. Einfache Relationen (2/3)
Beispiel: skos:broadMatch-Relation
<: DDC-Klassen-
inhalt ist weiter
gefasst als Klas-
seninhalt Klass-
Soz
m: nur ein Teil
des KlassSoz-
Klasseninhalts
findet sich in
DDC-Klasse
wieder
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 13
14. Einfache Relationen (3/3)
Beispiel: skos:narrowMatch-Relation
>: DDC-Klasse
ist enger ge-
fasst als Klass-
Soz-Klasse
m: Klassen-
inhalt KlassSoz
findet sich nur
zu einem ge-
wissen Teil in
DDC-Klasse
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 14
15. Mehrfache Relationen (1/2)
Beispiel: 1:n-Relation
>/>: Inhalt der KlassSoz-
Klasse findet sich in
beiden DDC-Klassen
h/m: Inhalt der
KlassSoz-Klasse deckt
sich deutlich stärker
mit der obigen
DDC-Klasse
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 15
16. Mehrfache Relationen (2/2)
Beispiel: n:1-Relationen
</<: die Inhalte
beider KlassSoz-
Klassen sind in der
DDC-Klasse enthalten
m/m: beide KlassSoz-
Klassen machen ca. die
Hälfte der DDC-Klasse
aus
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 16
18. Schwierigkeiten beim CK-Aufbau
Manche Klassen der Klassifikation Sozialwissenschaften
lassen sich nicht abbilden (z.B. „10508 – spezielle
Ressortpolitik“, darin u.a. Agrar-, Energie, Forschungs-
und Innenpolitik).
Manche Unterschiede zwischen Klassen der
Klassifikation Sozialwissenschaften sind in der DDC
nicht vorgesehen (z.B. „DDC 372 Primarbildung“: Enthält
Elementar- und Primarbildung.
Sammelklassen sind in der DDC vielfach nicht vorge-
sehen (z.B. „10599 – Sonstiges zur Politikwissen-
schaft“).
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 18
19. Ausblick
Crosskonkordanz-Aufbau DDC > KlassSoz
Nutzen für den Datenbankaufbau:
Übernahme der DDC-Notation bei DNB-Datenimport möglich
Interoperabilitätszunahme/Retrieval-Nutzen:
KlassSoz als Sucheinstieg für nach DDC erschlossener
Literatur
Repräsentation der Mappings in SKOS-Format
- Abbildung der Klassifikation Sozialwissenschaften in SKOS und
Modellierung der aufgebauten Crosskonkordanzen
- Verlinkung der Klassifikationssysteme über die in der SKOS-
Klassifikation hinterlegten URIs
- Suchraumerweiterung zu im Web verfügbaren Datenquellen
19
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013
20. Vielen Dank
für Ihre Aufmerksamkeit!
Dr. Andreas Oskar Kempf
GESIS – Leibniz-Institut für Sozialwissenschaften
andreas.kempf@gesis.org
www.gesis.org
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 20
21. Weiterführende Informationen
DDC Deutsch – Dewey-Dezimalklassifikation Deutsch
http://www.dnb.de/DE/Wir/Projekte/Abgeschlossen/ddcDeutsch.html;jsessionid=26240F5AD055
C5315A99413A4929D7EB.prod-worker3 (Zugriff am 04. März 2013)
Klassifikation Sozialwissenschaften: http://www.gesis.org/fileadmin/upload/dienstleistung/tools_
standards/Klassifikation_Sozialwissenschaften.pdf (Zugriff am 04. März 2013).
Mayr, Philipp; Petras, Vivien (2008): Cross-concordances - terminology mapping and its effectiveness
for information retrieval: In: World Library and Information Congress: 64th IFLA General Conference and
Meeting, Québec http://archive.ifla.org/IV/ifla74/papers/129-Mayr_Petras-en.pdf.
Petras, Vivien (2010) Heterogenitätsbehandlung und Terminology Mapping durch Crosskonkordanzen –
eine Fallstudie. In: Sieglerschmidt, Jörg/Ohly, Peter (Hg.) Wissensspeicher in digitalen Räumen.
Nachhaltigkeit, Verfügbarkeit, semantische Interoperabilität. Würzburg: Ergon-Verlag, 91-102.
Schott, Hannelore/Schroeder, Albert (2004) Crosskonkordanzen von Thesauri und Klassifikationen. In:
Budin, G.;Ohly, Hans-Peter (Hg.) Wissensorganisation in kooperativen Lern- und Arbeitsumgebungen.
Würzburg: Ergon-Verlag, 41-49.
SKOS-Mapping-Relations http://www.w3.org/TR/2009/REC-skos-reference-20090818/ (Zugriff am
04.März 2013).
5. Kongress Bibliothek & Information Deutschland, Leipzig, 11.-14. März 2013 21