Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
1. 15.04.13
1
Suchmaschinen und Bibliotheken
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
http://www.bui.haw-hamburg.de/lewandowski.html
@Dirk_Lew
Herausforderungen für Bibliotheken
• Nutzer verwenden Suchmaschinen zur Suche nach
„Bibliotheksinhalten“
• Nutzer suchen heute schon mit unterschiedlichen Werkzeugen
• Universalsuchmaschinen
• Spezialsuchmaschinen
• Social Bookmarking / Empfehlungssysteme
• Spezialdatenbanken
• OPACs
• Suchmaschinen „erziehen“ Nutzer zu „schlechtem“
Rechercheverhalten.
• Suchmaschinen zielen auf Kernbereiche der Bibliotheken
– Buchsuche
– Wissenschaftliche Inhalte
2. 15.04.13
2
„Most people are looking for quick wins.“
Nicholas, 2008
• Beispiele aus der wissenschaftlichen Suche
• Nutzer kommen über Suchmaschinen, schauen herum und nehmen das mit, was sie
brauchen können.
• Es wird eine Vielzahl von Quellen benutzt.
• Die Hälfte der Nutzer betrachtet nur 1-3 Seiten.
• 40% der Nutzer kommen innerhalb von sechs Monaten nicht mehr auf die Website
zurück.
• Nutzer sehen sich Artikel online nur ein paar Minuten lang an, vor allem kurze Artikel
werden gelesen.
• Nutzer sammeln zwar Artikel (als Ausdrucke oder Downloads), lesen sie dann aber
nicht.
„Katalog 1.0“
4. 15.04.13
4
Stärken der Biblothekskataloge
OPAC Suchmaschine
Einfache Suche schwach, da Anordnung der
Treffer nach Datum
stark, da gutes Ranking
Erweiterte Suche Guter Funktionsumfang Geringer Funktionsumfang,
fehlerhafte Funktionen (!)
Trefferanordnung /
Ranking
schlecht, da nur Anordnung
nach Datum; Ranking stark
vereinfachend
gut, da durchdachtes Ranking und
Durchmischung der Trefferlisten
Trefferpräsentation wenig flexibel durch Autor/Titel/
Jahr
Trefferbeschreibung mit statischen
und kontextabhängigen Elementen
Datenbestand nur ein Teilbestand des
Bibliotheksangebots
Einbindung aller von der SM
aufgebauterer Kolllektionen
Metadaten Mit hohem Aufwand erstellte
Qualitätsdaten
Kaum Ausnutzung von Metadaten;
keine eigene Erstellung
Ranking: Missverständnisse
• Ein klares Sortierkriterium ist besser als ein Ranking nach Relevanz.
– Ranking verändert nicht die Anzahl der Ergebnisse, sondern nur die Reihenfolge.
– Andere Sortieroptionen können angeboten werden.
• Bibliothekskataloge arbeiten ohne Ranking
– Konventionelle OPACs sortieren nach dem Erscheinungsjahr.
• Ranking ist nutzlos: Es funktioniert einfach nicht.
– Es ist schwer, “Relevanz” zu bestimmen. Relevanz ist sowohl vom Kontext
abhängig als auch vom individuellen Nutzer. Trotzdem kann Ranking wenigstens
eine befriedigende Trefferliste ergeben.
• Ranking ist gar nicht so kompliziert. Man muss doch nur ein paar
Standardmaße (TF/IDF) anwenden.
– Text matching reicht für ein gutes Ranking bei weitem nicht aus!
5. 15.04.13
5
Fehlendes Verständnis des Nutzerverhaltens bzw. der
Nutzerbedürfnisse
• Auswahl des Informationssystems
• Verständnis von den Inhalten des Systems („alles“)
• Anfragetypen
Konkreter vs. problemorientierter Informationsbedarf
• Konkreter Informationsbedarf
– Wie hoch ist die Zugspitze?
– Wie viele Einwohner hat Hamburg?
– Wie lautet die Web-Adresse des Departments Information der HAW?
• Problemorientierter Informationsbedarf
– Welche Interpretationsmöglichkeiten gibt es zum Homunculus aus Goethes Faust,
2. Teil?
– Welchen Einfluss hat der Schriftsteller Kyril Bonfiglioli auf die englische Literatur
gehabt?
– Wie gut eignen sich die Tagebücher von Samuel Pepys als historische Quelle?
6. 15.04.13
6
Konkreter vs. problemorientierter Informationsbedarf
Frants, Shapiro und Voiskunskii 1997, Übersetzung Stock
CIN POIN
Thematische Grenzen sind klar abgesteckt. Thematische Grenzen sind nicht exakt
bestimmbar.
Die Suchfrageformulierung ist durch exakte
Terme ausdrückbar.
Die Suchfrageformulierung lässt mehrere
terminologische Varianten zu.
Eine Fakteninformation reicht i.d.R. aus, um
den Bedarf zu decken.
In der Regel müssen diverse Dokumente
beschafft werden. Ob der Informationsbedarf
damit abschließend gedeckt ist, bleibt offen.
Mit der Übermittlung der Fakteninformation
ist das Informationsproblem erledigt.
Mit der Übermittlung der
Literaturinformationen wird ggf. das
Informationsproblem modifiziert oder ein
neuer Bedarf geweckt.
Anfragetypen in Bibliothekskatalogen
Lewandowski 2010, S. 94
7. 15.04.13
7
Suchmaschinen und Information Overload
• Zugang zu Informationen durch Suchmaschinen
– Masse (viele Mrd. Dokumente indexiert)
– Aktualität (allerdings nur schwer in der Recherche bestimmbar)
– Funktionierendes Ranking
• Information Overload
– „Information Overload kann anhand der Menge der Informationen definiert
werden, die ein Mensch zu verarbeiten in der Lage ist. Übersteigt die
Informationsmenge, die dieser Mensch für seine Arbeit benötigt und verarbeiten
kann, für einen nennenswerten Zeitraum sein Fassungsvermögen, so würde er
unter Information Overload leiden.“ (Lewandowski, 2012)
Strategien gegen Information Overload
• Vermeidungsstrategien bzw. unsystematische Linderung
– Informationen ignorieren
– Beschränkung auf eine Quelle bzw. Quellengruppe
• Strategien
– Technische Filter
– Informations- bzw. Recherchekompetenz
• Quellenauswahl
• Durchführung der Recherche
• Aufbereitung der Ergebnisse
– Überdenken des Anspruchs auf Vollständigkeit
(Lewandowski, 2012)
8. 15.04.13
8
Informationskompetenz: Missverständnis aus bibliothekarischer
Sicht
• Verständnis von Informationskompetenz als
– Kenntnis relevanter Fachdatenbanken
– Recherchekompetenz in diesen Datenbanken
• Alternativer Ansatzpunkt:
– Kompetente Nutzung der sowieso verwendeten Informationssysteme
– Aufzeigen der Stärken und der Schwächen dieser Informationssysteme
• Informationskompetenz der Information Professionals?
Für welche Web-Recherchen braucht man
Informationskompetenz?
(Lewandowski, Drechsler & von Mach, 2012)
9. 15.04.13
9
Bewertung des Sucherfolgs durch Nutzer
• Bewertung nach Anfragetypen
– Informationsorientiert à Nachweis schwierig (Annahme: 50% eindeutig bewertbar)
– Navigationsorientiert à Nachweis eindeutig (Annahme: 100% eindeutig bewertbar)
– Transaktionsorientiert à Nachweis leicht bis schwierig (Annahme: 50% eindeutig
bewertbar)
Informationskompetenz im Prozess der Websuche
• Auswahl der Suchmaschine
• Eingabe der Suchanfrage
• Trefferselektion auf Basis der Trefferbeschreibungen
• Evaluierung des individuellen Ergebnisses
11. 15.04.13
11
Vielen Dank für die Aufmerksamkeit.
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg,
Department Information
http://www.bui.haw-hamburg.de/lewandowski.html
dirk.lewandowski@haw-hamburg.de
@Dirk_Lew