Presentation at the Jahrestagung of the Institut für Österreichische Geschichtsforschung, 9.–11. November 2016, Vienna:
http://bioeg.hypotheses.org/1925
VernetzungZum Verhältnis von klassischen Formen der Archiverschließung und IT-gestützter Information Retrieval, 10.11.2016
1. Vernetzung
Zum Verhältnis von klassischen Formen
der Archiverschließung und IT-gestützter
Information Retrieval
Georg Vogeler
Zentrum für Informationsmodellierung
Universität Graz
@GVogeler
http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at
2. Was Sie erwartet
1. Wie sehen die Digitalen
Geisteswissenschaften das Problem der
Archiverschließung?
2. Überblick über Stand der Diskussion „Suche“
und Konsequenzen für die Erschließung
3. Konkretisierung
3. Digital Geisteswissenschaften
Digitales und digitalisiertes Kulturerbe in seiner
• menschlichen Aneignung,
• geisteswissenschaftlichen Reflexion,
• hermeneutischen Kontextualisierung,
• informatischen Formalisierung,
• technischen Realisierung und
• statistischen Berechnung.
9. Creative Archive
• John Latham Archive (Velios 2011)
– Brüder Karamazov (Mitya, Ivan and Alyosha) als
Einstiegspunkte
• Bloodaxe (Schofield et al. 2015)
– Erschließung als künstlerisch reflektiertes Ereignis:
Nachträge und Randbemerkungen werden von
Automaten „nachgeschrieben“ (Ausstellung,
Twitter)
12. Information Retrieval
• „Bag of Words“
– incl. morphologische Normalisierung
• Gewichtung
– von der Ähnlichkeit zwischen Such- und
Informationsraum bis zu externen Relevanzkriterien
• „Semantische Suche“
– Abbildung auf Konzepte
• „Topic Modeling“ (LDA) u.ä.
– Statistische Muster
14. IR und Geschichswissenschaft
• „Jede Suche wird geprägt vom Vorwissen, das der
Suchende mitbringt, von der Kenntnis der
entsprechenden Zusammenhänge und
Fachbegriffe, von der Erfahrung und der Routine
im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)
15. IR und Geschichswissenschaft
• „Jede Suche wird geprägt vom Vorwissen, das der
Suchende mitbringt, von der Kenntnis der
entsprechenden Zusammenhänge und
Fachbegriffe, von der Erfahrung und der Routine
im Umgang mit den Hilfsmitteln.“ (Peter Haber 2011)
• Aber: „Although the building of contextual
knowledge is time-consuming, requiring broad
searches through vast amounts of archival
material, it appears to be an essential part of the
historical method.” (Duff / Johnson 2002)
17. Theoretische Ansprüche: „Tektonik “
1. Archivbildner hat die bestmögliche
Informationsstruktur gefunden.
2. Provenienz bildet Entstehungsumstände ab.
3. Einzelstücke sind ohne ihren Kontext nicht
verständlich.
4. Hierarchie erleichtert die Suche.
5. Hierarchische Ordnung erleichtert die
Erschließungsarbeit.
20. Theoretische Ansprüche: „Tektonik “
1. Archivbildner hat die bestmögliche
Informationsstruktur gefunden.
2. Provenienz bildet Entstehungsumstände ab.
3. Einzelstücke sind ohne ihren Kontext nicht
verständlich.
4. Hierarchie erleichtert die Suche.
5. Hierarchische Ordnung erleichtert die
Erschließungsarbeit.
21. Benutzerkultur und
technische Möglichkeiten
• Digitale Aktenführung und Forscherdatenbanken
bauen auf Verschlagwortung von
Einzeldokumenten auf.
• Einschränkung von Suchergebnissen über
Kategorien („Facettierte Suche“) statt
hierarchischer Zugang von oben nach unten.
22. Theoretische Ansprüche: „Tektonik “
1. Archivbildner hat die bestmögliche
Informationsstruktur gefunden.
2. Provenienz bildet Entstehungsumstände ab.
3. Einzelstücke sind ohne ihren Kontext nicht
verständlich.
4. Hierarchie erleichtert die Suche.
5. Hierarchische Ordnung erleichtert die
Erschließungsarbeit.
23. Benutzerkultur und
technische Möglichkeiten
• Digitale Aktenführung und Forscherdatenbanken
bauen auf Verschlagwortung von
Einzeldokumenten auf.
• Einschränkung von Suchergebnissen nach
Kategorien („Facettierte Suche“) statt
hierarchischer Zugang von oben nach unten.
• Graphendatenbanken als Abbildung von
Assoziationen
24. Benutzen wir die Archivtektonik für
das, was sie wirklich kann!
1. Der Bestand ist eine (mögliche) Aggregation.
=> Die Bestandsbeschreibung gilt für alle
Einzelstücke
z.B. zur
• Suchexpansion
• Gewichtung
25. Benutzen wir die Archivtektonik für
das, was sie wirklich kann
1. Der Bestand ist eine (mögliche) Aggregation.
=> Die Bestandsbeschreibung gilt für alle Einzelstücke
2. Die Archivtektonik ist Kontext für ihre
Bestandteile.
=> Deklarieren wir ihre Beziehung klarer:
z.B.
• als Akteur
• Kommunikationspartner
• Aufgabenbereich
35. Z.B. Provenienzforschung
• Wiedergutmachungsverfahren:
Strukturierte Daten erhalten
• Enteignungen und Rückerstattung in Stichwörtern:
Höhere Gewichtung von Aggregationen
• Unterstützung der Exploration („erlernte Suche“):
– Objekten, die keinen Rückerstattungsanspruch
geschaffen haben => Gestapo-Akten zur Auflösung
jüdischer Gemeinden.
42. Archivische Netze?
• Visuelle Notation für archivische Kontexte
– Farben und Symbole für die Kontexte (Aktenbildner,
Zuständigkeiten, ...)?
– Archivtektonik als Teilkreise oder Verknüpfung?
– Größe der Kreise steht für Umfang der Bestände?
• Archiverschließung als Verknüpfung
– Mehr Archiverschließung in knappen Aussagen, die
sich leicht auf „Subjekt Prädikat Objekt“-Strukturen
abbilden lassen?
• Experimente
– mit Archivsoftwareherstellern?
– mit Digitalen Geisteswissenschaftlern?
43. Es dankt
für Ihre Aufmerksamkeit ...
Georg Vogeler
georg.vogeler@uni-graz.at
http://www.i-d-e.dehttp://informationsmodellierung.uni-graz.at
Julian Holzapfl, Joachim Wild, Walter Jaroschka, Michael
Wischnath, Alfred Straub für Ihre archivische Expertise
... und ...
44. Literatur
• Jefferson Bailey: Disrespect des fonds. Rethinking arrangement and description in born-digital archives, in:
Archive Journal 3 , 2013 <http://www.archivejournal.net/issue/3/archives-remixed/disrespect-des-fonds-
rethinking-arrangement-and-description-in-born-digital-archives>.
• Wendy M. Duff and Catherine A. Johnson: Accidentally Found on Purpose: Information-Seeking Behavior of
Historians in Archives, in: The Library Quarterly: Information, Community, Policy, Vol. 72, No. 4 (Oct., 2002), pp.
472-496
• Peter Haber: digital.past. Geschichtswissenschaft im digitalen Zeitalter, München 2011.
• ICA: Records in Contexts. A Conceptual Model for Archival Description, Consultation Draft v0.1, September
2016 <http://www.ica.org/sites/default/files/RiC-CM-0.1.pdf>
• Hea Lim Rhee: Modelling historians' information-seeking behaviour with an interdisciplinary and comparative
approach, in: Information Research 17,4 (2012), paper 544
• Stan Ruecker / Milena Radzikowska / Stéfan Sinclair: Visual Interface Design for Digital Cultural Heritage. A
Guide to Rich-Prospect Browsing, Aldershot 2011.
• Clay Shirky: Ontology is Overrated. Categories, Links, and Tags, in: O'Reilly ETech conference , 2005
<http://shirky.com/writings/ontology_overrated.html>.
• Urban Stäheli: Archivnetzplan. Ein neues Findmittel für die Online-Suche in Archivbeständen, in:
Informationswissenschaft: Theorie, Methode und Praxis, [S.l.], v. 4, n. 1, may. 2016.
<https://bop.unibe.ch/iw/article/view/2698/4019>
• Athanasios Velios: Creative Archiving. A Case Study from the John Latham Archive, in: Journal of the Society of
Archivists 32,2 (2011), S. 255-271.
• Stefano Vitali: La ricerca archivistica sul web, in: Il web e gli studi storici, hg. v. Rolando Minui, Rom 2015 (Studi
superiori), S. 61-106.
• Mitchell Whitelaw: The Visible Archive: Mapping the National Archives of Australia Collection, 2009
http://infosthetics.com/archives/2009/09/the_visible_archive.html
• Deborah A. Yakel u. Elizabeth Torres: AI: Archival Intelligence and User Expertise, in: American Archivist 44,1
(2003), S. 51-78.
• Geoffrey Yeo: Contexts, Original Orders, and Item-Level Orientation. Responding Creatively to Users' Needs and
Technological Change, in: Journal of Archival Organization 12 (2014), S. 170-185.
Notas do Editor
klassischen Formen der Archiverschließung (Findbuch, Archivtektonik) und IT gestützter Informationretrieval
z.B. Wie kann Informationsvisualisierung geisteswissenschaftlichen Forschungsstand abbilden? (Johanna Drucker, ...)
„Creative Archiving“ (Velios 2011) : John Latham Archive: Enter the archive as Mitya (MA) for a quick and careless browse of the material.
Enter the archive as Ivan (IA) for systematic research using faceted search tools.
Enter the archive as Alyosha (AA) if you believe you are an intuitive character.
John Latham (* 23. Februar 1921 in Livingstone, Nordrhodesien; † 1. Januar 2006 in London) war ein rhodesisch- britischer Konzeptkünstler, Maler, Bildhauer und Performancekünstler.[1]
; oder die „Archival Liveleness“ (Schofield et al. 2015) http://www.digitalhumanities.org/dhq/vol/9/3/000227/000227.html: themselves, we focused on marginalia as a material feature of the archive, developing a drawing machine and live Twitter bot: archive of a publisher of contemporary poetry, Bloodaxe Books: http://bloodaxe.ncl.ac.uk/
Mitya, Ivan and Alyosha
Enter the archive as Mitya (MA) for a quick and careless browse of the material.
Enter the archive as Ivan (IA) for systematic research using faceted search tools.
Enter the archive as Alyosha (AA) if you believe you are an intuitive character.
This is the website for Archive As Event (AAE), a Ligatus project funded by the AHRC to describe and digitise the John Latham Archive using Creative Archiving principles. Creative Archiving is about celebrating subjectivity and interpreting content through archiving practice. You can search the online archive through three different tools: MA, IA and AA. These are inspired by the three Karamazov brothers (Mitya, Ivan and Alyosha) in the Dostoyevsky book which was one of Latham's references, often in relation to the Observer series of works (e.g. Observer IV). Each document in the archive has been given a so-called Time-Base which corresponds to the relevance of the document to a classification system of Events that Latham proposed.
Enter the archive as Mitya (MA) for a quick and careless browse of the material.
Enter the archive as Ivan (IA) for systematic research using faceted search tools.
Enter the archive as Alyosha (AA) if you believe you are an intuitive character.
You can edit the archive documents as a Reflective Intuitive Organism (which could be considered as an elevated version of AA).
„Creative Archiving“ (Velios 2011) : John Latham Archive: Enter the archive as Mitya (MA) for a quick and careless browse of the material.
Enter the archive as Ivan (IA) for systematic research using faceted search tools.
Enter the archive as Alyosha (AA) if you believe you are an intuitive character.
John Latham (* 23. Februar 1921 in Livingstone, Nordrhodesien; † 1. Januar 2006 in London) war ein rhodesisch- britischer Konzeptkünstler, Maler, Bildhauer und Performancekünstler.[1]
; oder die „Archival Liveleness“ (Schofield et al. 2015) http://www.digitalhumanities.org/dhq/vol/9/3/000227/000227.html: themselves, we focused on marginalia as a material feature of the archive, developing a drawing machine and live Twitter bot: archive of a publisher of contemporary poetry, Bloodaxe Books: http://bloodaxe.ncl.ac.uk/
... statt Archivarserschließungssystem, Lesen des Findbuchs (von vorne bis hinten)
= Technische Möglichkeiten („unter der Haube“), vgl. Krenn
Semantische Suche= Einordnung von Suchbegriffen in Konzeptstrukturen (z.B. aus der Wikipedia, Wordnet), z.B. Disambiguierung, Verweise
Latent Dirichlet allocation
Daraus ergeben sich Benutzererwartungen:
(z.B. Metadaten, zunehmend auch Benutzerverhalten)
Side-of-a-Barn Principle“ (Bates 1986),
Side-of-a-Barn Principle“ (Bates 1986),
Beispiel Martin: Suche nach „Sammelindulgenz“ führt zu Illuminierten Urkunden
Wie wird dieses lernende Suchen unterstützt? =>
Unvollständigkeit der Klassifikation erfordert Verweise; viele Verweise sind nicht mehr weit weg von einem einfachen Netzwerk
= Beobachtung
= Was die Bibliothekare daraus machen
= technische Repräsentation der Theorie, gibt es einige davon – und zwar als generelle DB nicht als fertige Archivprodukte.
= Beobachtung
= Was die Bibliothekare daraus machen
= technische Repräsentation der Theorie, gibt es einige davon – und zwar als generelle DB nicht als fertige Archivprodukte.
= Beobachtung
= Was die Bibliothekare daraus machen
= technische Repräsentation der Theorie, gibt es einige davon – und zwar als generelle DB nicht als fertige Archivprodukte.
Klassische „Archivische Intelligenz“: Wiedergutmachtungsverfahren als Aktenniederschlag; zuständige Behörde: Wiedergutmachungsbehörde III für Ober- und Mittelfranken als „Rest“-Behörde, die die Verfahren aus den regionalen Behörden übernimmt.
Kartei als Behördenerschließung:
=> Wäre doch leicht in eine Datenbank zu überführen, oder?
Achtung: Az ist unvollständig! Also: Archivische Behandlung nötig.
Saubere Abbildung von Vorgängen => Aber Verlust der Differenzierung der Kategorien
DDB: zwei Einträge im Bundesarchiv (https://www.deutsche-digitale-bibliothek.de/searchresults?isThumbnailFiltered=false&query=Enteignung+J%C3%BCdischer+Besitz)
Archivportal-D: 2 Einträge, zu denen die Hierarchie angezeigt werden kann, die zeigt, daß der zweite Eintrag eine Bestandsbeschreibung ist.
Hierarchie zeigt, daß der Schriftverkehr mit Bormann (BArch, B 323/102 ) vom Referenten „Sonderauftrag Linz“ stammt.
=>
Gut, daß Bestandsbeschreibung auch gefunden wird.
Schlecht, daß erst nach Aufblättern einer riesigen Hierarchie klar ist, daß der BArch, B 323/102 teil von B323 ist => bessere Visualisierung der Bestandszugehörigkeit? Den Handlungsbezug der Tektonik klarer machen?
Warum ist der Bestand nicht höher gereiht? Warum ist die Beziehung zwischen Einzelstück und Bestand nicht gleich klar?
Erlernte Suchwege:
Per Computerlinguistik aus Bestandsbeschreibungen inferierbar?
Sicher in Assoziationspfaden abbildbar: Tell me the story (Akteure, Objekte, Handlungen/Rollen in Ereignissen)
Erlernte Suchwege:
Per Computerlinguistik aus Bestandsbeschreibungen inferierbar?
Sicher in Assoziationspfaden abbildbar: Tell me the story (Akteure, Objekte, Handlungen/Rollen in Ereignissen)
Erlernte Suchwege:
Per Computerlinguistik aus Bestandsbeschreibungen inferierbar?
Sicher in Assoziationspfaden abbildbar: Tell me the story (Akteure, Objekte, Handlungen/Rollen in Ereignissen)
Was gibt es nun schon in dieser Netzwerkaufbereitung von Archivalien?
William Shirley = William Shirley (* 2. Dezember 1694 in Preston, Sussex; † 24. März 1771 in Roxbury, Massachusetts) war ein britischer Kolonialgouverneur in Nordamerika.
Vgl. https://www.nypl.org/blog/2014/07/31/networked-catalog
Aber: Notation nur auf VE und Kategorienart abgebildet, man kann noch weiter gehen:
Big Data Infrastructure Visualization Application) is a dynamic environment for browsing, searching, and interacting with the ARC (Advanced Research Consortium)
Bestandsumfang und Laufzeit sind abbildbar, auch wenn der Bestand nur ein Datensatz ist.
Facettierung ist ein moderner Klassiker der Erschließung, wird auch zunehmend in Archivsoftware praktiziert.
Das Problem ist, daß die Archiverschließung noch auf textueller Reduktion beruht: Rollen, Aussagen.
Zeitliche Eingrenzung
Stichwortsuche und zeitliche Eingrenzung
Durchklicken => Pfade werden angezeigt
... ich hätte Lust darauf. Melden Sie sich, wenn Sie auch Lust darauf haben!
Größe der Kreise nach Umfang der Bestände
Erschließungskriterien als Verknüpfungen
Archivtektonik als „Teilkreis“? wie „Link“
Bei den Archivsoftwarehersteller nachfragen?
Weniger deskriptive Archiverschließung, mehr „Graphen“-orientierte „knappe Einzelaussagen“ und „kontrollierte Vokabularien“
Diskussion:
Provenienz als „ontologische Substantia“
Achtung auf Unterscheidung zwischen „Provenienz“, „Tektonik“ und „Klassifikation“
Experimente mit graphischen Visualisierungen: Glauert fragen (glauert (at) fh-potsdam.de )
Città degli archivi 2013 (http://www.cittadegliarchivi.it/footer/documenti-di-progetto-1/breve-storia-sul-progetto-una-citta-per-gli-archivi): cool!
(z.B. Metadaten, zunehmend auch Benutzerverhalten)
http://www.archivinformationssystem.at/suchinfo.aspx
Volltext – Archivplan – Feld – und Deskriptoren gehören zusammen:
Volltextsuche „Rechnung Vorarlberg“ liefert 0 Treffer; „Rechnungen Vorarlberg“ aber schon einen: Lemmatisierung please!
Warum finde ich keinen Hinweis auf den Deskriptor „Ort = Vorarlberg“? mit 15 Treffern (darunter auch ein Bestand: http://www.archivinformationssystem.at/detail.aspx?ID=7021)
Gut ist der Weg in den Archivplan
Welche Funktionen hat die Archivtektonik dann unter den Gegebenheiten digitaler Möglichkeiten?
Welche Funktionen hat die Archivtektonik dann unter den Gegebenheiten digitaler Möglichkeiten?
William Shirley and topic presidential candidate: not connected directly