SlideShare uma empresa Scribd logo
1 de 37
Multilinguale Informations- und Retrievalsysteme
Dr. Ulrich Kampffmeyer, PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
VOI Verband Optische Informationssysteme, Roßdorf bei Darmstadt
Vorsitzender des Vorstandes
PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH
Wachenheim, Hamburg, Darmstadt
Abstract
This paper on multilingual information and retrieval systems with optical mass
storage describes the technical principles of software design. The different layers
and modules from the user interface via transformation modules, thesaurus modules
and fulltext interpretation to database management are explained in detail. Three
examples of multilingual document imaging systems are presented:
- HYPARCHIV multilingual standard optical filing software for Microsoft
Windows and Novell Netware;
- wfBase multilingual press and commerce information system base on
four ISDN-knots in Switzerland;
- HEMIS multilingual information system for CD-ROM distribution on
environmental institutions, projects and programmes of the
UN Environmental Programme UNEP/HEM.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 1 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Gliederung Seite
1 Bedeutung multilingualer Softwaresysteme mit optischen Speichern für
den europäischen Wirtschaftsraum
...................................................................................................................
4
2 Software-Design
...................................................................................................................
5
2.1. Struktur und allgemeine Anforderungen an multilinguale
Software
.......................................................................................................
5
2.2 Benutzeroberfläche und Anwendung
.......................................................................................................
8
2.3 Transformationsmodule
.......................................................................................................
12
2.4 Auswahllisten
.......................................................................................................
14
2.5 Thesauri
.......................................................................................................
16
2.6 Volltextinterpretation
.......................................................................................................
21
3. Anwendungsbeispiele
...................................................................................................................
25
3.1 HYPARCHIV
.......................................................................................................
25
3.2 wfBase
.......................................................................................................
29
3.3 HEMIS
.......................................................................................................
31
ONLINE ´93 Kongress IV
Seite 2 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
4. Ausblick
...................................................................................................................
37
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 3 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
1 Bedeutung multilingualer Softwaresysteme mit optischen Spei-
chern für den europäischen Wirtschaftsraum
Europa 1993 ist ein vielbenutztes Schlagwort. Auch nach Öffnung der Grenzen und
Beseitigung der Handelshemmnisse bleiben sprachliche und kulturelle Barrieren
bestehen. Diese betreffen alle unternehmen und Organisationen, die in verschiede-
nen Ländern tätig sind.
Die Sprachbarriere betrifft nicht nur die reine Sprachverstehen- und Sprach-über-
setzungsebene, sondern schließt mehrere Ebenen unterschiedlicher Interpretation,
Bedeutung in verschiedenen Zusammenhängen und Umsetzung in Fachnomenklatur
ein. Im Wirtschaftsleben ist nicht die Umsetzung in die Umgangssprache sondern
die Einhaltung "ungeschriebener" Gesetze der Fachsprache ausschlaggebend.
Neben den unterschiedlichen sprachlichen Anforderungen sind Umrechnungen von
Maßen und Währungen, Umstellungen von Formaten (Datum, Adresse, Schreib-
weisen) etc. erforderlich.
Multilinguale Software ist überall dort erforderlich, wo auf gleiche Information unab-
hängig von der Art der Quelle zurückgegriffen werden muß. Dies betrifft insbeson-
dere
- Handelsunternehmen
- Dienstleistungsunternehmen
- internationale Behörden und Organisationen
- Produktionsunternehmen mit Sublieferanten in
unterschiedlichen Ländern
- Kommunikationsunternehmen
- Banken
- Versicherungen
- Kontrollinstitutionen
(Flugsicherung / Polizei / Katastrophenschutz / Umweltdaten)
- etc.
Vielerorts wird die englische Sprache als Standard für die Kommunikation erachtet.
Die Benutzung einer Fremdsprache kann jedoch zu Fehlinterpretationen führen,
wenn die genaue Bedeutung von Begriffen und Zusammenhängen nicht bekannt ist.
Umgangssprachkenntnisse sind hier nicht ausreichend. Je komplexer Software und
die zugrunde liegenden Informationen werden, desto komfortabler und umfassender
muß die Unterstützung durch das Programm werden. Dies betrifft insbesondere
Anforderungen an die Gestaltung der Benutzeroberfläche, Mitteilungen zur
gegenwärtigen Aktion, Zustands-meldungen, kontextsensitive Hinweise (besonders
bei Fehlbedienung oder kritischen Programmverzweigungen) sowie Hilfetexte.
Letztere müssen als Index wie auch kontextsensitiv zur Verfügung stehen.
Moderne "Windows"-orientierte Programme verfügen in der Regel über diese Eigen-
schaften. Wie die meisten Programme sind sie jedoch nur in einer Benutzersprache
gehalten.
ONLINE ´93 Kongress IV
Seite 4 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Standardsoftware wird heute hauptsächlich von wenigen großen Softwarehäusern in
den USA hergestellt. Dies bedeutet,daß Software und Dokumentation zunächst in
Englisch oder in amerikanischem Englisch vorliegen. Von dieser Ursprungsversion
ausgehend werden verschiedene nationale Versionen erstellt. In Abhängigkeit von
der Bedeutung eines Marktes liegen diese mehr oder weniger verzögert in unter-
schiedlichen Release-Ständen vor. In einem solchen Standardprogramm sind häufig
die Bildschirm-darstellungen, zugehörige Texte etc. im Hauptteil des Programms
enthalten. Dies macht eine Übersetzung mit Anpassung der Darstellung und zusätz-
lichen Tests sehr aufwendig.
Auch wenn auf die gleichen Daten zugegriffen werden kann, ist ein Wechsel der
Benutzersprache während der Laufzeit nicht möglich, sondern das anderssprachige
Programm muß zeitaufwendig komplett geladen werden. Auch verfügen die meisten
Standardprograme über keine integrierte Datenbank oder Ressourcen-Management-
Komponente, die die Verwaltung der verschiedenen Sprach- und Funktionsmodule,
sogar deren Erstellung und Pflege erleichtern würden.
Herkömmliche Standardsoftware ist daher bereits aus Design-Gesichtpunkten nicht
multilingual ausgelegt. Der vorliegende Artikel beschäftigt sich mit multilingualen
Informationssystemen, die auf einer Datenbank basieren.
2 Software-Design
Multilingualität muß ebenso wie das modulare Zuladen von Programmteilen oder
Funktionen bereits beim Entwurf eines Programms berücksichtigt werden. Die nach-
trägliche Umstellung einer vorhandenen Software ist kaum möglich. In einem
solchen Fall eis ein komplettes Redesign unter Einsatz moderner Tools sinnvoller.
2.1. Struktur und allgemeine Anforderungen an multilinguale Software
Multilinguale Software folgt folgenden Designkriterien (Abb. 1):
a) Modulares Design mit klarer logischer und programmtechnischer Trennung der
verschiedenen Ebenen (Benutzerschnittstelle, Hauptprogramm, Ressourcen,
Transformations-Module, Datenbank, etc.) Die Interaktion wird über Nachrich-
ten (Messages) und globale Variablen gesteuert.
b) Keine Textkomponente darf in ausführenden Programmteilen enthalten, son-
dern muß über Variable referenziert sein. Die Umschaltung von einer Sprache
zur anderen erfolgt über ein globale Variable.
c) Die Texte werden strukturiert in Ressource-Libraries (Bibliotheken) gehalten
und werden über Variablen aufgerufen. Diese Bibliotheken müssen einfach zu
pflegen und die Texte zur Laufzeit aufrufbar sowie in der Applikation ladbar
sein.
d) Alle Teile einer Anwendung müssen über definierte Schnittstellen verfügen.
Dies betrifft insbesondere die Benutzerschnittstelle, die eigentliche Applikation
und das Betriebssystem sowie die Zusatzmodule der Applikation.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 5 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
e) Applikation, Benutzerschnittstelle und Betriebssystem müssen variable Text-
feldlängen und -positionen unterstützen. Diese können in Abhängigkeit der
gewählten Sprache unterschiedlich sein.
f) Applikation, Betriebssystem, Bildschirm- und Druckertreiber sowie die Daten-
bank müssen unterschiedliche Fonts, Zeichensätze, Sortierungen, Datums-
formate, etc. unterstützen. Voraussetzung ist die Eignung des Betriebssystems.
Multilingual Software - Design Principles
Modular design with clear separation
of user interface, operating system and application (database)
Every text component has to be referenced by a key variable in the application
Resource libraries easy to link and to maintain (i.E. text editor)
Defined interfaces between the user interfaces, operating system
and application modules
Variable textfield positions and field-lengths in the user interface modules
of the application
Support of different sets of fonts, language specific characters,
keyboard layouts, date formats etc. by the underlying operating system
Abb. 1: Designkriterien multilingualer Software
Die multilinguale Anwendung gliedert sich dementsprechend in verschiedene
Module und Ebenen, die miteinander kommunizieren (Abb. 2). Das eigentliche
Anwendungsprogramm, das Teil der Datenbankanwendung sein kann, steuert über
Nachrichten und globale Variable die Wahl einer Sprache, deren Anzeige (und
Druck) sowie die eigentlichen Recherche- und Umwandlungsfunktionen.
ONLINE ´93 Kongress IV
Seite 6 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Principles of Language Display during Runtime
Screen
Text Field
German
English
French
Spanish
Language Resources
Please select ...
Application
Resource Data
Data-
base
Selection
Lists
Thesauri
Trans-
formation
Modules
The language selector (Lx) in the application defines which
resource is used for display and how the information in the
datafield is represented
Screen
LX
LX
LX
Abb. 2: Sprachanzeige während der Laufzeit des multilingualen Programmes
Die Variable "Lx" für "Language Resource" bestimmt, welche Texte angezeigt und
welche Transformationsmodule und Auswahllisten benutzt werden, um eine Eingabe
oder eine Recherche in der angewählten Sprache zu steuern. Die Information in der
Datenbank selbst wird nicht verändert, nur Anzeige und Ausdruck werden umge-
setzt.
Die verschieden Schichten einer multi-lingualen Anwendung sind auf Abb. 3 darge-
stellt.
Language
Resources
Trans-
formation
Modules
Selection
Lists
Thesauri Language
Interpreter
User interface
(Windows, Presentation Manager, X-Windows, etc.)
Database
User interface (Application)
Application
Operating
System
IRS Information Resources Management Driver 4
1
2
3
Layers and Modules of Multi-Lingual Software
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 7 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Abb. 3: Schichten (1-4) und Module multilingualer Software
Schicht 1 beinhaltet im wesentlichen die Darstellung der Informationen, Schicht 2
dient zur Transformation der angezeigten Informationen von einer Sprache in eine
andere, Schicht 3 verwaltet die Zugriffsinformationen und dient zur Recherche,
Schicht 4 verwaltet die "Dokumente" (Datensätze, Bilder, Grafiken etc.) auf opti-
schen Speichermedien. Auf die letztgenannte Schicht 4, das IRS Information
Resources Management Programm soll in diesem Artikel nicht näher eingegangen
werden (vergleiche hierzu Kampffmeyer, Ulrich; "Kombinierte WORM- und magneto-
optische Massenspeicher und vorgangsorientierte Informationsverarbeitungs-
systeme", GI Gesellschaft für Informatik, Arbeitskreis "Datenbanken", Tagung am
19.2.1990, Universität Oldenburg, 1990). Die einzelnen Ebenen und die darin ent-
haltenen Komponenten werden im Folgenden erläutert.
2.2 Benutzeroberfläche und Anwendung
Die Benutzeroberfläche ist in starkem Maße von dem darunterliegenden Betriebs-
system abhängig. Viele Betriebssysteme werden den Anforderungen für multi-
linguale Software nicht gerecht, da sie zur Laufzeit nicht umkonfigurierbar sind und
keine internationalen Zeichensätze sowie Formate unterstützen. Für multilinguale
Anwendungen sind Betriebssysteme mit einer grafischen Benutzeroberfläche wie
Microsoft Windows, OS/2 Presentation Manager oder Oberflächen, die auf
XWindows basieren (OSF Motif, OpenLook u.a.) gut geeignet. Sie gestatten die
Kontrolle der Bildschirmanzeige weitgehend unabhängig vom eigentlichen Betriebs-
system.
Es ist grundsätzlich zwischen
a) der Standard-Windows-Oberfläche und
b) der auf Basis dieser Oberfläche realisierten anwendungsspezifischen
Benutzeroberfläche zu unterscheiden. Letztere benutzt die Mittel, die von der
Standardoberfläche bereitgestellt werden, um die Funktionen der Applikation
darzustellen.
Eine grafische Oberfläche bietet zahlreiche Vorteile: Vom verringerten Lernaufwand,
integrierte Hilfefunktionen bis zur einfachen Benutzerführung, die wahlweise über
Mausaktionen, Anwahl aus Menüleisten oder Tastaturkombinationen steuerbar ist.
Ein besonderer Vorteil von Windows-Oberflächen ist die frei skalierbare Größe von
Fenstern und anderen Anzeigen.
Es ist wenig sinnvoll für multilinguale Anwendungen alle Anzeigen in der Applikation
mit einer eigenen Benutzeroberfläche zu realisieren, da dies die Zahl der einsetz-
baren Bildschirm- und Druckertreiber einschränkt. Die Benutzeroberfläche der
Applikation sollte soweit möglich auf Standardroutinen der Windows-Oberfläche
zurückgreifen.
ONLINE ´93 Kongress IV
Seite 8 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
An die Benutzeroberfläche (Standard-Windows und Anwendungsoberfläche) sind
folgende Anforderungen zu stellen (Abb. 4 und 5):
a) Umschaltbarkeit der Tastaturbelegung während der Laufzeit gesteuert durch
die Applikation
b) Umschaltbarkeit der Bildschirmdarstellung während der Laufzeit gesteuert
durch die Applikation
c) Anzeigemöglichkeit von spezielle Zeichensätzen (z.B. Deutsch: ä, ö, ü, ß;
Französisch: é, è, ê, ç; Spanisch: Í; Dänisch: Ø, å, Æ; Ungarisch: ÿ, ý, ï;
Griechisch: α, β, χ; etc.)
d) Umschaltbarkeit von Formaten während der Laufzeit (z.B. Datum, Währung,
Zeit, etc.)
e) Automatische Anpassung der Anzeige am Bildschirm in Bezug auf unterschied-
liche Textlängen, Sonderzeichen, Fonts, etc. Die Anpassung muß in Abhängig-
keit der verfügbaren Bildschirmauflösung durchführbar sein.
f) Sprachabhängige, kontextsensitive Hilfe in Abhängigkeitder Position auf dem
Bildschirm, des aktuellen Programmzustandes und der durchgeführten oder
durchführbaren Aktion.
g) Zuladbare Module während der Laufzeit, ohne das Programm zu verlassen.
Operating System and User Interface
Requirements for European Software
The operating system and Window Interface must support several features
to enable switching the language during runtime
Change of keyboard setting and screen display during runtime via external program
Enhanced keyboard setting with special characters:
European languages ( ç, ê, æ, å, ø ,ä , etc. ).
Support and change during runtime of date and time formates
Graphic Interface with virtual Window architecture to allow different sizes
of screens and fields while changing the language
Context-sensitive help in relation to the actual position of the cursor
Abb. 4: Betriebssystem und Benutzerschnittstelle
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 9 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
User Interface (application)
Requirements
The user interface has to support several functions to enable change of
language during runtime
Object oriented software
Change of screens, settings and styles during runtime
Dynamic positioning of fields
Automatic adaption of different field lengths
Controllable by the application program
Loadable modules during runtime for messages, windows and helptexts
Dynamic data and message interchange with operation system and user interface,
application program and database
Abb. 5: Benutzerschnittstelle
Wichtigstes Merkmal einer multilingualen Anwendung ist die Umschaltbarkeit
während der Programmausführung, ohne daß ein anderes Programm geladen und
gestartet werden muß und ohne daß sich der Bildschirmaufbau und angezeigten
Informationen (inhaltlich) ändern (Abb. 4).
Die einzelnen Textkomponenten werden in separaten Dateien gehalten, sog.
"Resource Libraries" (Abb. 2). Diese werden zur Laufzeit in Abhängigkeit der
Sprachenwahlvariable "Lx" geladen.
Vorausbedingung für die Benutzung von Sprachressourcen ist, daß alle Texte in
einem Programm, die angezeigt oder gedruckt werden sollen, durch eine eindeutige
Schlüsselvariable mit der zugehörigen Bibliothek referenziert sind (Abb. 2).
"Resource Libraries" werden benötigt für:
a) alle statischen Textanzeigen auf einem Bildschirmformular ("Statische" Anzei-
gen sind Texte wie Beschriftungen, die sich erst beim Wechsel des Bildschirm-
formulars ändern). Dies sind Texte, die in der Regel mit einem bestimmten
Bildschirmformular fest verbunden sind.
b) dynamische Textanzeigen auf dem Bildschirmformular, die sich in Abhängigkeit
des Zustandes verändern oder einblenden (Messages). Hierzu gehört auch
das "Ausgrauen" von nicht aktiven oder auswählbaren Funktionen auf dem
Bildschirmformular (Schaltflächen) und in Menüauswahllisten.
c) Hilftexte, die automatisch erscheinen oder interaktiv abgerufen werden
(Helptexts).
ONLINE ´93 Kongress IV
Seite 10 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
d) Fehlermeldungen, Systemmeldungen und andere Hinweismeldungen, die
aktionsbezogen erscheinen.
Language Resources
Requirements
Language resources are used for displaying texts related to the unique keys in
the application
Loadable modules for each language
Every entry in the language resource is referenced by a unique key
which may be used by different applications and the database itself
Language resources are needed for
Every text on a entry or search screen form
Every message
Every helptext
Icons adapted for each country
Editor or tools for translation support
Abb. 6: Sprachressourcen
Viele Anwendungen benutzen Icons (Sinnbilder) und Schaltflächen zur verein-
fachten Anwahl von Funktionen. Sind sie mit Texten versehen oder durch
Buchstaben (als Abkürzung) gekennzeichnet, so müssen auch diese Icons bei
einem Sprachwechsel umgeschaltet werden. Es empfiehlt sich daher, auch die
Sinnbilder in eigenen Ressourcen-Bibliotheken zu halten und nicht direkt im
Programm zu verwalten. Gleiches gilt auch für Icons mit Grafiken, wenn die Grafik
Dinge zeigt, die in einem anderen Sprachraum oder Land, nicht mit der gezeigten
Funktion des Icons verknüpft werden.
Objektorientierte Programmiersprachen und Datenbanken unterstützen häufig die
Benutzung von ladbaren Ressourcen und sind deshalb herkömmlichen Tools vorzu-
ziehen.
Für die Erstellung der eigentlichen Anwendung, die sich auf eine Programmier-
sprache oder eine Datenbankprogrammiersprache stützen kann, ist die Wahl des
geeigneten Tools wichtig. Die Anwendung stellt die übergreifende und integrative
Komponente im gesamten System dar (vgl. Abb. 2 und Abb. 7). Die Applikation
beinhaltet nicht nur die üblichen Algorithmen zur Datenverarbeitung und Module für
Ein- und Ausgabe, sondern ebenfalls die Steuerung und Auswahl der Sprach-
ressourcen (Transformationsmodule, Auswahllisten, Thesauri, Hilfetexte, Mitteilun-
gen und Hinweistexte, Bildschirmaufbau und -anzeige, etc.).
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 11 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Application
Characteristics
Object oriented message driven program
Direct control of database and user interface
Numeric keys for every text entry related to the screen display and database fields
Transformatters, selection lists, thesauri, language interpretors and
language resources as loadable modules
Database as loadable module or server-client-communication via SQL
Abb. 7: Anwendungskomponente
Objektorientierte Programme mit einem "Message"- Konzept, wie es z.B. Microsoft
Windows beinhaltet, erlauben die ständige Kontrolle über die verwendeten Ressour-
cen und den Zustand der Bildschirmanzeigenzeige. Für die Kontrolle der Module auf
Ebene 2 (vgl. Abb. 3) sollte eine direkte Kommunikation aufgebaut werden. Für die
Kommunikation mit der Datenbank, in der die eigentlichen Information verwaltet und
gehalten wird, kann SQL als standardisierte Kommunikationsschnittstelle benutzt
werden. Alle Module der Schichten 2, 3 und 4 (vgl. Abb. 3) sollten während der
Laufzeit direkt aufrufbar oder zuladbar sein.
2.3 Transformationsmodule
Die numerischen Informationen in der Datenbank werden in einem Format abgelegt,
daß bei Bedarf für eine bestimmte zugeladene Sprachressource gewandelt wird.
Diese Wandlung wird ebenfalls durch die Variable "Lx" gesteuert (Abb. 2). Trans-
formationsmodule sind wesentlich einfacher als Textübersetzer zu realisieren, da sie
nach genauen Regeln und nur mit numerischen Werten arbeiten (Abb. 8).
ONLINE ´93 Kongress IV
Seite 12 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Transformation Modules
Types
Transformation modules are used for the display transfomation
of numeric values of the database
Transformation of date formates
Transformation of time formates
Transformation of addresses
Transformation of units of measure
Transformation of international standardized
nomenclature
Transformation of user-defined values
(supported by operating system)
(supported by operating system)
(position of postal codes, etc. )
(litre to gallon, km to mile, etc. )
(country and city names, etc. )
(see selection lists, etc. )
Abb. 8: Transformationsmodule
Die wichtigsten Standard-Transformationsmodule sind:
a) Datumsformatumwandlung
Dieses Modul wandelt die Anzeige zwischen amerikanischen (Monat-Tag,
Jahr) und europäischen (Tag-Monat-Jahr) Format um. Diese Funktion wird
häufig direkt vom Betriebssystem unterstützt und erlaubt auch die volle oder
abgekürzte Verwendung des Monatnamens. Das Transformationsmodul sollte
auch für die Umwandlung von Datumsformaten vor dem Jahr 2000 auf das
neue Jahrtausend hin ausgelegt sein. Dies ist wichtig für alle Datenbestände
mit Aufbewahrungspflichten von 7 Jahren und mehr. Das Datum-Transfer-
Modul muß ebenfalls für die richtige Sortierung bei der Anzeige sorgen.
b) Zeitformatumwandlung
Ähnliches wie für die Datumsformate gilt für die Transformation von Zeiten und
deren Anzeige. Für international agierende Unternehmen empfiehlt sich die
Speicherung von Zeitdaten im "coordinated universal time"-Format (UTC).
Datum- und Zeittransformationsmodule können so ausgelegt werden, daß sie
prüfen, ob die interne Zeiteinstellung des Systems korrekt ist (das aktuelle
Datum/Zeit muß immer jünger sein als das zuletzt gespeicherte Dokument;
Abgleich mit Standard-Arbeitszeiten und Werktagen; etc., um gegebenenfalls
des Ausfall der Systemzeit festzustellen und zu melden).
c) Adressen-Transformation
Die Adressenformat-Transformation betrifft mehr den Ausdruck als die Anzeige
am Bildschirm. Postanschriften sind in Europa nicht standardisiert und
benutzen unterschiedliche Reihenfolgen von Straße, Hausnummer und Post-
leitzahlen. Das Transformationsmodul erkennt, welches Land bei einem
Anschreiben gewählt ist und stellt für den Druck das richtige Adressformat ein.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 13 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
d) Transformation von Werten
Für international tätige Handels- und Produktionsunternehmungen stellt die
Transformation von Maß-, Entfernungs- und anderen Werten eine wichtige
Anforderung dar. Dies soll an einem Beispiel erläutert werden:
In der Mineralölindustrie werden täglich große Mengen unterschiedlicher Ölsor-
ten und Ölprodukte transportiert und zwischengelagert. Je nach Art, Gewicht
und Temperatur ändern sich Werte sowie davon abhängig Zoll- und Steuer-
sätze. Besonders bei grenzüberschreitendem Verkehr ist daher eine Umwand-
lung in die landesüblichen Einheiten erforderlich.
Zu den wichtigsten umrechenbaren Werten gehören Währungen sowie Entfer-
nungs-, Gewichts- und Hohlmaße.
e) EDI-Daten
Der standardisierte elektronische Datenaustausch (EDI - Electronic Data
Interchange), z.B. EDIFACT, erlaubt die Abwicklung kompletter Geschäfts-
transaktionen auf elektronischem Wege. Hierbei entstehen keine Papier-
originale mehr. Die Daten sind digital zu archivieren. Für die Anzeige und den
Ausdruck werden EDI-Codes in Texte umgesetzt. Diese Umsetzung in Klartext
kann durch eine Sprachsteuervariable ebenfalls sprachabhängig gemacht wer-
den. Bei EDI-Informationen ist zu berücksichtigen, mit welcher Version einer
bestimmten EDI-Anwendung die Daten zu transformieren sind.
Entsprechend verschiedener branchenspezifischer Anforderungen an eine Applika-
tion können weitere Transformationsmodule hinzukommen. Hierzu gehören z.B. die
Umsetzung von Produktcodes in Klartext.
2.4 Auswahllisten
Grafische Oberflächen wie Microsoft Windows unterstützen einfache (single select)
und mehrfach (multiple select) Auswahllisten (Abb. 9). Bei den erstgenannten Aus-
wahllisten kann aus der angezeigten Liste nur ein Eintrag markiert und übernommen
werden. Bei multiplen Auswahllisten können einer oder mehrere Einträge markiert
und übernommen werden.
ONLINE ´93 Kongress IV
Seite 14 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Selection Lists
Characteristics
Selection lists are an easy way to translate information
and to spare storage capacity
The list displays a text on the screen related to a database value
Every entry in a selection list refers to a value which is related to a database field
Every entry in the different language versions of a list refers to the same value
The database has to store only the numeric value of the entry
Selection lists help to standardize nomenclature in multinational and
multilingual organizations
Selection lists can be used as single and multiple-choice lists
Abb. 9: Auswahllisten
Auswahllisten bieten bei Datenbankanwendungen eine Reihe von Vorteilen gegen-
über Standard-Texteingabefeldern:
a) Auswahllisten vermeiden Tippfehler.
b) Auswahllisten sorgen für die Vereinheitlichung der Datenbank und stellen
sicher, daß ein eingegebener Eintrag eindeutig wiedergefunden wird. Sie sor-
gen für eine standardisierte Eingabe, bei der sich der Benutzer für einen
bestimmten Begriff entscheiden muß.
c) Bei Auswahllisten wird in der Datenbank nur eine Referenzziffer zu einer Text-
ressource gespeichert. Dies erfordert wenig Platz, kann in Abhängigkeit einer
Sprachanwahlvariable auf unterschiedliche Textressourcen verzweigen und
beschleunigt das Retrieval der Datenbank, da nur vordefinierte Ziffern und
keine Textsequenzen durchsucht werden müssen.
d) Multiple Auswahllisten erleichtern die Mehrfachzuordnung eines Dokumentes
und gestatten dem Anwender bei unsicherer Zuordnung zu nur einem Begriff
die zusätzliche Anwahl weiterer verwandter Begriffe.
Für multilinguale Anwendungen ist besonders die Option c) von Bedeutung. Sie
erlaubt durch die Verwendung von Referenznummern die Zuweisung zu mehreren
Listen in unterschiedlichen Sprachen. Weiterhin können die Referenznummern auch
für den Zugriffschutz benutzt werden, indem nur zulässige Begriffe bei einer
Recherche angezeigt werden. Auswahllisten erleichtern auch die Erfassung von
Informationen durch Voreinstellungen für häufig wiederkehrende Einträge.
Auswahllisten können mit Standard-Texteditoren erstellt werden. Dies sollte jedoch
nur von bestimmten autorisierten Personen geschehen, da Änderungen und beson-
ders Löschungen von Einträgen Merkmalen (Einträge in einer Auswahlliste) die
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 15 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Datenbankkonsistenz gefährden können. Bei verteilten Systemen und Ressourcen
ist die Einhaltung von strengen Update- und Pflegerichtlinien unerläßlich.
Auswahllisten mit kontrolliertem Wortschatz sind das geeignete Medium zur
Standardisierung der Nomenklatur in Unternehmen und zur Schaffung multilingualer
Softwaresysteme. Multilinguale Systeme sollten die freie Texteingabe nach Möglich-
keit vermeiden und Auswahllisten - wo immer sinnvoll und einsetzbar - verwenden.
2.5 Thesauri
Der Begriff "Thesaurus" wird sehr unterschiedlich benutzt. Ursprünglich steht er für
eine definierte Fachnomenklatur, die hierarchisch vom Grobem zum Feinen
heruntergebrochen ist. Die Begriffe sind in der Bedeutung von einander eindeutig
unterschieden und in mehreren Hierarchieebenen gegliedert, wobei mehrere
Begriffe auf einer unteren Hierarchieebene einem inhaltlich übergreifendem Begriff
auf der nächst höheren Ebene zugeordnet sind. Begriffe auf einer Ebene sollten
einen ähnlichen Detaillierungsgrad haben.
In vielen aus den USA kommenden Textverarbeitungsprogrammen wird der Begriff
"Thesaurus" für eine Hilfsfunktion zur Wahl geeigneter Synonyme benutzt. Diese Art
Thesaurus hat nichts mit der strukturierten Nomenklatur zu tun, wie sie z.B. durch
die International Standardization Organization (ISO) für einfache und multilinguale
Thesauri festgelegt ist.
Thesauri
Thesauri offer a hierachical structured and crosslinked nomenclature
One field on the screen may be represented by a structured hierarchical thesaurus
Similar to a selection list, the thesaurus displays a text related to a database value
related with this text
The thesaurus offers navigation and interpretation tools
The Thesaurus is a database of itself which relates numeric values to texts
and provides additional structure by hierarchic order and crosslinks
The structure of thesauri is standardized by ISO
The same thesaurus may be used by different applications
Abb. 10: Thesauri
ONLINE ´93 Kongress IV
Seite 16 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Die hier behandelten Thesauri für multilinguale Programmsysteme verhalten sich
nach außen ähnlich wie Auswahllisten (Abb. 10; vgl. auch Abb. 9). Es wird zunächst
eine Liste mit den Oberbegriffen angezeigt (ISO Top Term; TT). Bei der Anwahl
eines Oberbegriffs wird eine zweite Auswahlliste mit den zugeordneten Unter-
begriffen angezeigt (ISO Narrower Term; NT). Wird hier ein Begriff ausgewählt, so
bildet dieser den Oberbegriff (ISO Broader Term; BT) für die nächste Ebene von
Unterbegriffen (vgl. Abb. 11). Diese strenge Hierarchie ist auf die wenigsten Sach-
gebiete voll anwendbar. Der ISO-Standard sieht deshalb auch sogenannte
"Crosslinks" vor. Diese setzen Begriffe auf unterschiedlichen Ebenen und Verzwei-
gungen unabhängig von der Position in der Hierarchie zueinander in Beziehung.
Dies läßt sich mit einem Programmsystem einfacher als in gedruckter Form nach-
bilden.
Ein elektronischer Thesaurus wird programmintern ebenfalls durch Referenz-
nummern abgebildet (vgl. Auswahllisten). Im Gegensatz zu Auswahllisten sind
einem Eintrag im Thesaurus zusätzlich zum "unique Identifier" (eindeutige
Schlüsselnummer, die in der Datenbank gespeichert wird) die Anzeigeposition (auf
welche Ebene und Verzweigung in der hierarchischen Darstellung der Eintrag ange-
zeigt werden soll) und die Art (gegebenenfalls auch Art und Richtung) einer
Verbindung als Merkmale zugeordnet. Die Verbindungen erlauben die Zuordnung
eines Begriffes zu mehreren Oberbegriffen anderer Zweige wie auch die Zuordnung
als Oberbegriff zu verschiedenen Unterbegriffen in anderen Verzweigungen
unabhängig von der Position innerhalb der Hierarchie. Die Verwendung unterschied-
licher Links (uni-direktional, bi-direktional, broad-to-narrow, narrow-to-broad,
additional reference, synonym, etc.) macht die Navigation in einem solchem System
einfacher. Im Prinzip stellt ein elektronischer Thesaurus eine eigene Datenbank-
anwendung dar, die zwischen Benutzeroberfläche und eigentlicher Datenbank
geschaltetet ist.
In der Datenbankanwendung wird nur der "Unique Identifier" abgespeichert. Ist
dieser mit einem "Narrower Term" referenziert, können über die Verbindungen und
die Position in der Hierarchie alle zum Begriff gehörigen Oberbegriffe und der "Top
Term" erschlossen werden.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 17 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Thesauri
Hierarchy and Crosslinks
The Hierarchical View of the Thesaurus
(Top Term, Broader Term, Narrower Term)
The Network Structure of the Thesaurus
(Crosslinks independent of the hierarchical position)
7
6
5
4
3
21
7
6
8
4
3
21
1220
1210
1120
1110
1200
11001000
1220
1210
1120
1110
1200
11001000
Unique identifier Position in hierarchical view
Abb. 11: Hierarchie und von virtuelle Verbindungen (Crosslinks)
Ein elektronischer Thesaurus wird intern als Netzwerk abgebildet (relationales
System), nach außen aber als Hierarchie präsentiert. Die Zusammenstellung einer
Liste von Begriffen ist daher nicht nur vom Oberbegriff, sondern auch von den Ver-
bindungen und dem Weg, auf dem man zum Oberbegriff gelangt ist, abhängig. Im
Gegensatz zu Auswahllisten können Listenanzeigen eines elektronischen
Thesaurus je nach Situation unterschiedlich zusammengesetzt sein.
Neben der Navigationshilfe durch die Anzeige der Auswahllisten in Abhängigkeit
eines zuvor gewählten Oberbegriffs kann ein Datenbank-gestützter Thesaurus auch
in unterschiedlichen "Spezialisten"- und "Anfänger"-Modi benutzt werden. Bei der
Erfassung von Informationen ist ein "Spezialisten"-Modus sinnvoll, bei dem ein
Unterbegriff oder ein Kürzel direkt eingegeben werden kann und die Datenbank
selbsttätig die dazugehörigen Oberbegriffe ohne Durchlaufen der Hierarchie
ermittelt. Bei einer Recherche durch Benutzer, die keine Erfahrung mit
hierarchischen Auswahllisten oder mit dem sachlichen Inhalt des Thesaurus haben,
ist ein "Anfänger"-Modus sinnvoll, bei dem die Texteingabe des Benutzers
analysiert, auf einen "Match" im Thesaurus durchsucht wird und im Zweifelsfall
durch Hinzuziehung von Synonym-Listen und Hilfetexten eine Empfehlung zur
Wiederholung oder Konkretisierung der Anfrage angezeigt wird. Eine solche "Global
Search" kann auch über weitere Felder oder andere zum Thesaurus gehörende
Ressourcen durchgeführt werden.
ONLINE ´93 Kongress IV
Seite 18 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Abb. 12 zeigt, wie mehrere "Scheiben" den eindeutigen Schlüsselvariablen der
Thesaurus-Datenbank zugeordnet sind. Jede der Sprachscheiben enthält auch alle
Informationen, wie die Begriffe hierarchisch und vernetzt angeordnet sind, da die
Ordnung von Sprache zu Sprache verschieden sein kann (Begriffsunschärfen,
feinere oder gröbere Unterteilungen). Unabhängig von den Differenzen in der
Sprache muß aber immer die gleiche Information eindeutig auffindbar sein. Neben
dem eigentlichen Begriff (Main Keyword) sind deshalb auch Acronyme
(Abkürzungen aus den Anfangsbuchstaben von zusammengesetzten Begriffen oder
Namen), Homonyme (gleichlautende Begriffe unterschiedlichen Inhalts), Synonyme
(anderslautende Begriffe ähnlichen oder gleichen Inhalts), Pluralformen des Begriffs,
etc. sowie eine erklärende Hilfe dem "Unique Identifier" zugeordnet. Bei einer
"Global Search" werden diese mitdurchsucht.
In einer solchen "Sprachscheibe" muß jedoch nicht unbedingt eine Fremdsprache
enthalten sein, es können auch unterschiedliche Ressourcen in einer Landes-
sprache benutzt werden. Dies ist sinnvoll, wenn es sich um Fachinformationen
handelt. So kann z.B. in einer "Scheibe" die umgangssprachliche Information ent-
halten sein, die nur zwei bis drei Ebenen enthält und Nicht-Fachspezialisten
zugänglich ist, und in einer zweiten "Scheibe" die Fachnomenklatur fein aufge-
gliedert in weiteren Ebenen, die nur dem Fachmann zur Verfügung steht. Damit läßt
sich auch Umfang, Tiefe und Zugriff zur Information steuern.
Thesauri
"Slice"- Model of a Multilingual Thesaurus
ID´s
dec
ID´s
dec
German Language "Slice"
ID´s
dec
ID´s of pre-
decessors
ID´s of suc-
cessors
position in
hierarchy
main key
wordn
synonyms, ho-
monyms etc.
ID´s
dec
ID´s of suc-
cessors
position in
hierarchy
main key
wordn
synonyms, ho-
monyms etc.
Unique
ID
A1
Unique
ID
A2
Unique
ID
A3
Unique
ID
An
...
ID´s of pre-
decessors
ID´s of suc-
cessors
position in
hierarchy
... ...
ID´s of pre-
decessors
main key
wordn
synonyms, ho-
monyms etc.
help text
help text
help text
French Language "Slice"
ID´s of suc-
cessors
position in
hierarchy
main key
wordn
synonyms, ho-
monyms etc.
help text
ID´s of pre-
decessors
help text
English Language "Slice"
help text
help text
ID´s of pre-
decessors
ID´s of suc-
cessors
position in
hierarchy
main key
wordn
synonyms, ho-
monyms etc.
ID´s of pre-
decessors
ID´s of suc-
cessors
position in
hierarchy
main key
wordn
synonyms, ho-
monyms etc.
ID´s of pre-
decessors
ID´s of suc-
cessors
position in
hierarchy
main key
wordn
synonyms, ho-
monyms etc.
help text
ID´s of pre-
decessors
ID´s of suc-
cessors
position in
hierarchy
main key
wordn
synonyms, ho-
monyms etc.
Abb. 12: "Scheiben"-Struktur eines multilingualen Thesaurus
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 19 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Der Nutzen einer elektronischen Thesaurus-Datenbank neben der modularen
"Scheiben"-Struktur für multilinguale Anwendungen ist vielfältig:
a) Standardisierter, kontrollierter Wortschatz sichert das eindeutige und voll-
ständige Wiederfinden aller korrekt erfaßten Informationen.
b) Eingabefehler werden vermieden.
c) Auswahllisten und Hilfefunktionen erleichtern die Navigation durch umfang-
reiche und tiefgegliederte Fachnomenklatur.
d) Funktionen wie "Global Search" erlauben die Suche auch im Synonym-,
Homonym-, Acronym- und anderen Verweiseinträgen sowie im Hilfetext selbst.
e) Aufbau und Struktur von Thesauri sind international standardisiert.
f) Eine Thesaurus-Datenbank arbeitet als "Pre-Processor" und spart Zeit bei der
Suche in der eigentlichen Datenbank, da nur noch kurze, eindeutige
numerische Referenzen durchsucht und ausgewertet werden. Die Umsetzung
der Schlüsselzahlen für die Anzeige erfolgt wiederum durch den Thesaurus.
g) Thesaurus-Datenbanken können auf PC-Rechnern in einem Netzwerk lokal
betrieben werden und entlasten damit als "Pre-Processor" die zentrale Daten-
bank und das Information Resources Management (IRS; siehe unten und Abb.
3).
Wird zusätzlich zur Thesaurus-Datenbank und zur eigentlichen Datenbank eine
Verwaltungssoftware zur Ansteuerung optischer Systeme eingesetzt, so ergibt sich
eine dreistufige Datenbankhierarchie (vgl. Abb. 3 und Abb. 26):
a) Datenbank für einen oder mehrere Thesauri (lokal oder zentral)
b) Datenbank zur Verwaltung von Schlüsselzahlen zu Auswahllisten und Thesauri
sowie von standard Datenbankeinträgen (numerisch, alphanumerisch, Datum,
Zeit, boole´sche Variable, etc.)
c) Information-Retrieval-and-Access-System (IRAS). In der Regel eine Non-
Standard-Datenbank zur Verwaltung nur einmal beschreibarer WORM-Medien,
wiederbeschreibarer optischer Speicher (Erasable, Rewritable, M/O) oder nur
lesbarer Speicher (CD-ROM).
Für eine Thesaurus-Datenbank kann ebenso wie für die eigentliche Anwendung eine
Standard-Datenbank eingesetzt werden (vorzugsweise eine relationale Datenbank).
Volltext-Datenbanken sind für diese Art der Anwendung nicht geeignet (Abb. 13).
ONLINE ´93 Kongress IV
Seite 20 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Database
Characteristics
Support of optical disk information retrieval system for mass data management
Standard relational database may be used to manage data
(except for language interpretation)
Standard fulltext database are not usable
Abb. 13: Merkmale für das Datenbanksystem
2.6 Volltextinterpretation
Die elektronische Interpretation und Übersetzung von Volltext folgt gänzlich anderen
Strategien als die bisher beschriebenen Techniken. Transfomationsmodule, Aus-
wahllisten und Thesauri lassen sich beliebig kombinieren und in einem System ver-
einigen, da sie alle nach der gleichen Regel arbeiten: numerische Kennziffern
werden nach festgelegten Regeln eindeutig in vordefinierte, kontrollierte Begriffe
oder andere Werte umgesetzt.
Ein System, das die Analyse von Volltext erlaubt, ist nur schwer mit den vorge-
nannten Modulen zu kombinieren. Es ist ein eigenständiges komplexes Software-
system, das sich aus verschiedenen Komponenten zusammensetzt (Abb. 14 und
15):
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 21 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Language Interpreter
Characteristics
The language interpreter contains different modules which allow
translation and interpretation of fulltext databases.
Dictionaries provide information for the direct translation of nouns
(singular, plural, conjunctions, etc.)
Statistical modules support the interpretation of the noun inside a text
Linguistic modules support the interpretation of the grammatical context
Comparision modules combine the different strategies of interpretation
Presentation modules display the answer of a query in the chosen language
as translated fulltext
Inverted file and cache modules optimize access
Abb. 14: Merkmale eines Sprachinterpretationssystems
Language Interpreter
Structure
Presentation
Modules
Linguistic
Modules
Statistic
Modules
Dictionaire
Modules
User Interface
Entry Query
Comparision
Inverted File
Database
Display
Language
Interpreter
ONLINE ´93 Kongress IV
Seite 22 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Abb. 15: Struktur eines Sprachinterpretationssystems
a) Wörterbuchkomponenten beinhalten die einzelnen Worte in verschiedenen
Formen (Plural, Singular, Konjugation, Deklination, irreguläre Verben, etc.) Das
Wörterbuch stellt in der Regel eine eigene Datenbankanwendung dar. Es ist
jedoch grundverschieden in Struktur, Aufbau und Inhalt des zuvor diskutierten
Thesaurus.
b) Statistik-Module analysieren das Vorkommen und die Zusammensetzung von
Worten und Wortkombinationen.
c) Linguistik- und Grammatik-Analyse-Module stellen den am schwierigsten zu
realisierenden Teil dar. Sie beinhalten alle Regeln und Vergleichsbeispiele für
die Analyse der Syntax. Hierfür werden häufig Techniken der Mustererkennung
(Pattern Recognition) und Fuzzy Logic eingesetzt.
d) Die Ergebnisse der drei Module a), b) und c) werden in einem Vergleichsmodul
zusammengeführt, gewertet und interpretiert. Das Vergleichsmodul ist so
konzipiert, daß es Zwischenergebnisse eines Moduls zur Auswertung an ein
anderes Modul zurückgeben kann. So entsteht ein iterativer Prozeß mit einer
relativ hohen Erkennungsrate bei fachbezogenen Texten, für die es spezielle
elektronische Wörterbücher mit der Fachnomenklatur gibt.
e) Da herkömmliche Datenbanken aufgrund ihrer Architektur mit der zeitinten-
siven Volltextauswertung wenig effektiv sind, werden häufig spezielle "Cache"-
und "Inverted File"-Module zwischengeschaltet.
f) Präsentations- oder Darstellungsmodule sorgen für die korrekte Wiedergabe
der übersetzten Texte am Bildschirm. Sie werden mit Informationen aus dem
Wörterbuchmodul, dem ausgewerteten Text aus der Datenbank und dem
"Inverted File"-System gespeist.
Das beschriebene Volltextinterpretationssystem kann zur Auswertung von Klartext-
Anfragen benutzt werden. In Abb. 15 ist der Bearbeitungsweg für eine Anfrage
dargestellt. Bei der Umsetzung eines Textes aus der Datenbank werden die Module
in gleicher Weise von unten nach oben durchlaufen. Die vorgestellte Lösung stellt
nur eine mögliche Konfiguration dar. Da diese Technik sehr neu ist, werden auch
zahlreiche andere Ansätze verfolgt. Der hier vorgestellte Ansatz hat den Vorzug,
daß zugleich verschiedene Module mit unterschiedlichen Auswertungsstrategien
durchlaufen werden. Jedes Modul kann zudem auf bestimmte Sprachen oder Fach-
nomenklaturen spezialisiert und bei Bedarf automatisch vom Vergleichsmodul zuge-
schaltet werden. Die Interpretation und Übersetzung eines Textes ist sehr zeitauf-
wendig und in der Regel nur auf schnelle Dialog-Rechnern möglich. Komplexe
Systeme wie das beschriebene sollten nicht mit einfachen Übersetzungshilfen
verwechselt werden.
Herkömmliche Volltextdatenbanken sind für solche Systeme selten geeignet. Die
Strategie bei Standarddatenbanksoftware ist, Füllworte, Adjektive, Adverbien etc.
wegzulassen, um Speicherplatz zu sparen, sowie die Geschwindigkeit der Daten-
bank zu erhöhen. Bei einem sprachinterpretierenden System werden jedoch alle
Informationen des Textes benötigt, da ansonsten keine zusammenhängende und
kontextbezogene Übertragung möglich ist.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 23 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Erste Erfolge mit dem Einsatz von "Language-Interpreter"-Datenbank-Systemen
wurden bei der UNO und der Europäischen Kommission erzielt.
Die Wahl einer Strategie für multilinguale Datenbankanwendungen ist heute noch
einfach:
a) Für Dokument-orientierte (Faksimile) Systeme, Anwendungen mit kontrollier-
tem Wortschatz und Systeme, die zu einer Standardisierung der Benutzung
führen sollen, ist der Ansatz mit Transformations-, Auswahllisten- und
Thesaurus-Modulen zu wählen.
b) Für Anwendungen im Volltextbereich, die nicht innerhalb der nächsten drei bis
vier Jahre in den Produktionsbetrieb gehen sollen, ist die Erprobung oder
Beschäftigung mit dem hier beschriebenen Ansatz sinnvoll.
Kommerziell nutzbare, sofort einsatzfähige Standardsoftware existiert zur Zeit weder
für a), noch für b). Auch in Zukunft ist nicht mit "Off-the-shelf"-Lösungen zu rechnen,
da die Art der Anwendung und die zu verwendende Nomenklatur immer Änderungen
erfordern wird.
Ideal ist jedoch nach Meinung des Verfassers ein Ansatz, wie er in Abb. 3 dargestellt
ist. Hier sind die verschiedenen Umsetzungs- und Interpretationskomponenten in
einer Schicht zusammengefaßt und arbeiten parallel. Sie verbinden die Benutzer-
oberfläche mit der eigentlichen Datenbank. Ein solcher integrativer Ansatz verbindet
die Vorzüge aller genannten Techniken, die in einer Anwendung nach Bedarf
einzeln oder kombiniert eingesetzt werden können.
ONLINE ´93 Kongress IV
Seite 24 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
3. Anwendungsbeispiele
Anhand von drei Beispielen sollen multilinguale Informations- und Retrievalsysteme
anwendungsorientiert erläutert werden:
Abb. 16: Anwendungsbeispiele
a) HYPARCHIV Standard "Document-Imaging"-Software für Microsoft Windows
b) wfBase Presse- und Wirtschaftinformationen in einem verteilten
"Document-Imaging"-System
c) HEMIS Umweltinformationen auf CD-ROM
3.1 HYPARCHIV
HYPARCHIV ist ein vollständig in Deutschland entworfenes und programmiertes
Archivierungssystem für Faksimile-Dokumente und Dateien. HYPARCHIV wird als
Einzelplatz- und als Netzwerkversion in allen wichtigen europäischen Sprachen
angeboten. Es unterstützt zahlreiche Scanner, Drucker, "Image-Boards" und
optische Speicher (WORM, M/O, Jukeboxen). Weitere Module erlauben die auto-
matische Indizierung von Dateien (COLD), Faxversendung und Empfang, Daten-
austausch mit externen Datenbanken, Dokumentenaustausch zwischen ver-
schiedenen HYPARCHIV-Systemen und zusätzliche Datensicherung (Krypto-
graphische Kodierung). Zur einfachen Generierung von Anwendungen existiert ein
"WYSIWIG"-Editor.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 25 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Die Auswahl der Beispiele aus einer Vielzahl anderer erfolgte auf Basis der vom Autor selbst
durchgeführten Projekte. Als Marketing- und Sales-Manager sowie Systemberater der ACS
Systemberatung GmbH war der Verfasser von 1989 - 1992 für Design, Entwicklung und Vermarktung
von HYPARCHIV, sowie in den Jahren 1990 - 1992 für das Design und Projektmanagement von
wfBase verantwortlich. Seit 1990 betreut der Verfasser das HEMIS-Projekt.
HYPARCHIV
European standard for PC-based optical filing software
Optical filing software for Microsoft Windows 3.1
supporting various scanners, printers, optical disks and jukeboxes
Novell Netware 3.11
Server-client-architecture, object-oriented design
Triple Access: Hierarchy with icons, relational database and hyperlinks
Multi-lingual user interface, available in English, US-English (with icons for
Folders, Cabinets, etc.), French, German, Dutch, Swedish, Greek, Hungarian,
Spanish, Portuguese, etc.
User interface, messages and help switchable during runtime
Selections in different languages locally available, but not direct multi-lingual
database support (multi-lingual thesaurus available in1993 with new
server / client solution)
ACS Systemberatung GmbH, Germany
Abb. 17: Merkmale von HYPARCHIV
Das Programm besitzt eine grafische Benutzeroberfläche, die Ordnungsmittel und
Funktionen ikonisiert darstellt. HYPARCHIV gestattet mehrere frei kombinierbare
Zugriffs- und Informationsverwaltungstechniken:
a) Hierarchische Ordnung mit Aktenschränken, Ordnern, Mappen, etc.
b) Datenbank, formulargesteuert mit "Query by Example" (QBE). HYPARCHIV
unterstützt mehrere Anwendungen gleichzeitig mit Umschalten der Datenbank
während der Laufzeit.
c) Hyperlinks zur virtuellen Verbindung von Objekten (Notizen, Ordnungsmittel,
Dokumente und Dateien)
ONLINE ´93 Kongress IV
Seite 26 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Abb. 18: Der grafische "elektronische Schreibtisch" von HYPARCHIV (angewählte Sprache:
Deutsch)
HYPARCHIV unterstützt die Multilingualität nur an der Benutzeroberfläche: Menues,
Hilfetexte, Meldungen, Ikonen, Knöpfe, Dokumentbeschriftungen, etc. werden
während der Laufzeit durch eine einfache Menu-Anwahl umgeschaltet. Der
"elektronische Schreibtisch" und der Zustand des Systems ändert sich nicht. Die
komplette Systemumschaltung dauert ca. 2 Sekunden inklusive Anpassung aller
Texte, Fenster und Ikonen auf dem Bildschirm. Für Datenbankmasken (Bildschirm-
formular) können mit Einschränkungen Arbeitsplatz-bezogen auch verschiedene
Auswahllisten hinterlegt werden, die auf die numerischen Schlüssel des gleichen
Datenbankfeldes referenzieren. Dadurch ist eine eingeschränkte Multilingualität
auch für die HYPARCHIV-Datenbank gegeben.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 27 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Abb. 19 zeigt eine dreisprachige Pressearchivanwendung. Hier sind auf der Daten-
bankmaske die Texte in allen drei Sprachen angegeben. Die Schaltfelder
"Documentation", "Press review" und "Bibliography" verzweigen auf Untermasken.
Hinter den Feldern "Sachgebiet" und "Schlagworte" liegen Auswahllisten, die lokal in
jeweils einer der drei Sprachen vorgehalten werden. Alle anderen Feldinhalte
werden nicht übersetzt und erscheinen in der Eingabesprache.
Abb. 19: Dreisprachige Datenbankmaske einer Pressearchivanwendung für HYPARCHIV
Von HYPARCHIV ist inzwischen auch eine Client-Server-Version mit einem multi-
lingualen Thesaurus verfügbar. Die letztgenannte Version wird jedoch nicht als
Standardprodukt vertrieben. Die verfügbare Standardversion HYPARCHIV NET für
Novell-Netzwerke wird in Europa bereits mehr als 200 mal eingesetzt. Von der
Einzelplatz- und der STARTER-Version wurden mehrere tausend verkauft.
HYPARCHIV hat sich damit zum europäischen Standard für Windows-basierte
"Optical-Filing"-Systeme entwickelt.
ONLINE ´93 Kongress IV
Seite 28 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
3.2 wfBase
wfBase ist eine individuelle Applikation, die für die Schweizer Wirtschaftsförderung
(wf) entwickelt worden ist. wfBase befindet sich seit 1992 im Produktionsbetrieb.
Die Zentrale der Schweizer Wirtschaftsförderung (wf) ist in Zürich. Außenstellen
befinden sich in Genf, Bern und Lugano. Vor der Einführung von wfBase wurden an
allen vier Orten Dossiers über politische Ereignisse, Wirtschaftsdaten, etc.
unabhängig von einander geführt. Ziel von wfBase ist, allen internen Benutzern
Zugriff auf Presseartikel, Zeitschriften und selbst erzeugtes Schriftgut unabhängig
von der Eingabesprache zu ermöglichen (vgl. Abb. 20 und 21).
wfBase
wf Schweitzer Wirtschaftsförderung
Swiss Institute for Commercial Development
Zürich - Geneva - Bern - Lugano
The wf owns one of the largest archives on commercial and political topics in
Switzerland. It provides information to politicians, journalists and its commercial
members representing all major companies of Switzerland.
Optical filing system for press and commercial documents
(scanned and created via word processor, sreadsheet, etc. )
Distributed system linked via SwissNet 2 (ISDN)
Access for wf-employees and third-party partners via multilingual graphic
user interface (ISDN and telephone modem)
Database with 4-lingual thesaurus
Access to information independent of the language in which it was entered
Several million documents stored on M/O-Jukeboxes (2 times 50 gigabyte)
Integrated bureau communication with textprocessing, spreadsheet, FAX,
library management, electronic mail, accounting, address database, etc.
Abb. 20: wfBase - Ausstattung und Merkmale
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 29 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
wfBase
Storage and Communications Layout
Harddisk Cache
Zürich
Images, Files & Descriptors
Read / Write / Create
Harddisk Cache
Lugano
Images, Files & Descriptors
Read / Create
Harddisk Cache
Geneva
Images, Files & Descriptors
Read / Create
Harddisk Cache
Bern
Images, Files & Descriptors
Read / Create
wf-User
wf-User
wf-User
wf-User
Jukebox
External Use
Jukebox
Internal Use
DB Server
Zürich
Archive - Server
Zürich
Communications -
Server
Zürich
External User
Harddisk Cache
Addresses
Library
Dossiers
ISDN
Telephone
Modem&
ISDN
SwissNet 2
ISDN
SwissNet 2
ISDN
SwissNet 2
Novell
Netware
Abb. 21: wfBase - Systemkonfiguration mit internen und externen Teilnehmern sowie Informations-
verwaltung in zwei Jukeboxen (Zürich)
wfBase integriert unter seiner grafischen Oberfläche auch andere Anwendungen
zusätzlich zur Dokumentenverwaltung. Hierzu gehören Textverarbeitungs- und
Spreadsheet-Anwendungen, Adress- und Bibliotheksverwaltung, Abrechnung für
externe Nutzer des Systems, elektronischer Faxeingang und -ausgang, elek-
tronische Posteingangs- und Ausgangskörbe, etc. wfBase benutzt Module von
HYPARCHIV, ist im Übrigen aber eine eigenständige Anwendung mit Client-Server-
Architektur und einer relationalen Datenbank auf einem OS/2-Server. Die
Arbeitsplätze unter Microsoft Windows sind in einem Novell-Netzwerk
zusammengeschlossen. Außer den internen Nutzern können auch Dritte sich in
wfBase über Modem einwählen, Dokumente ("Subset") abfragen, lokal anzeigen und
drucken oder per Fax sich senden lassen.
Die vier Standorte der wf sind über Hochleistungs-SwissNet2 (ISDN) miteinander
verbunden (vgl. Abb. 21). Dies erlaubt auch die Übermittlung von komprimierten
gescannten Faksimiles. In zwei Jukeboxen sind neben gescannten Faksimiles auch
selbst erzeugte Dateien und eingegangene Faxmitteilungen gespeichert. Das
System ist weitgehend fehlertolerant und ausfallsicher ausgelegt.
Kernstück von wfBase ist die Datenbank mit einem viersprachigen Thesaurus für die
Sachgebiets-Klassifikation (Deutsch, Französisch, Italienisch und Englisch). Der
Thesaurus beinhaltet über 2.000 Sachgebiete, die hierarchisch und in einer Link-
Struktur in vier Ebenen gegliedert sind.
ONLINE ´93 Kongress IV
Seite 30 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
wfBase
Multilingual Thesaurus
The two images show different views of the thesaurus for thematic
keywords (here in German). The thesaurus supports the user in navigation,
jump-functions, short-key-entries, synonym-retrieval and other techniques for
easy-to-use access.
Screen I
aus Vortrag Online ´92
Thesaurus-Maske
Sachgebiet
für Vortrag auf Folie
einkleben
Screen II
aus Vortrag Online ´92
Thesaurus-Maske
Sachgebiet
für Vortrag auf Folie
einkleben
Abb. 22: wfBase - multilingualer Thesaurus. Die Abbildung zeigt zwei Fenster der Bildschirmdar-
stellung des Thesaurus. Links ist angezeigt, wie von einem Oberbegriff auf eine Liste von
Unterbegriffen verzweigt wurde. Der Thesaurus beinhaltet die in den Dossiers erfaßten
Sachgebiete
Neben dem Thesaurus existieren Auswahllisten für andere Felder sowie Text- und
Dateneingabefelder. Mit der Datenbank können die Dokumente unabhängig von der
Sprache, in der sie erfaßt wurden, gefunden werden. Die Anzeige erfolgt jedoch in
derjenigen Sprache, in der das Dokument erzeugt wurde. In einem multilingualen
Staat wie der Schweiz ist die Übersetzung des Inhaltes nicht erforderlich. Ziel von
wfBase ist vielmehr die Kommunikation zwischen den wf-Standorten zu verbessern,
Adress- und Dokumentenbestände zu vereinheitlichen, Redundanzen abzubauen
und Dritten (Mitgliedern der wf-Trägerschaft) einen einfachen, Zeit- und Kosten-
sparenden Zugriff zu erlauben.
3.3 HEMIS
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 31 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Die Vereinten Nationen haben im Rahmen ihrer Umweltorganisation (United Nations
Environmental Programme - UNEP) eine Instituion zur Harmonisierung von Umwelt-
meßmethoden, -vorhaben, -projekten und -informationen gegründet (UNEP/HEM -
Harmonization of Environmental Measurement). Im Münchner Büro von UNEP/HEM
wird seit 1990 ein Projekt zur Schaffung eines Informations- und Meta-Daten-
banksystems durchgeführt (HEMIS - HEM Informations System). HEMIS soll in
Bezug auf Umweltforschung, Umwelt-"Monitoring" und Umweltschutz einen Über-
blick über
a) Laufende Projekte im globalen und nationalen Umfang der UN, anderer inter-
nationaler und großer nationaler Organisationen im Umweltbereich,
b) Institutionen, Forschungsschwerpunkte, Periodika und leitende Mitarbeiter,
c) Methoden, Referenzmaterialien, etc.,
d) Datenbanken, Datenformate, Datenqualität, Zugang, etc.
geben (vgl. Abb. 27). Die in HEMIS enthaltenen Informationen sind Meta-Daten, die
aus den unterschiedlichsten Quellen kompiliert werden (vgl. Abb. 23 und Abb. 27).
HEMIS
UNITED NATIONS ENVIRONMENTAL PROGRAMME
HARMONIZATION OF ENVIRONMENTAL MEASUREMENT
UNEP / HEM, Nairobi / Munich
The UNEP / HEM Office harmonizes nomenclature, measurements and other
information used worldwide in environmental projects. This task will be
supported in the future by the HEMIS meta-database and information system,
a multilingual CD-ROM using PC-system.
Multilingual thesauri for scientific nomenclature, countries, climates, etc.
with references, links, synonyms, homonyms, acronyms and wildcard-functionalitity
Harmonization of nomenclature by standardized access to Information
Hyperlinks, guided tours, global search facilities together with the thesaurus
enable easy access to the Information independent of the language of entry
CD-ROM based worldwide distribution
Abb. 23: HEMIS - Informations- und Meta-Datenbanksystem der UN Umweltorganisation UNEP/HEM
Ziel ist die Harmonisierung des Zugriffs auf heterogene Informationen unterschied-
licher Qualität, verschiedenen Umfangs und aus diversen Quellen.
Das HEMIS hat zwei Systemkomponenten:
ONLINE ´93 Kongress IV
Seite 32 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
a) In München wird ein System installiert werden, mit dem alle Informationen
gesammelt, aufbereitet, inhaltlich erschlossen und verwaltet werden. Das
System soll in der Lage sein, aus seiner Datenbank heraus selektierte Berichte
(printouts) und CD-ROM-Datenbanken zu erstellen.
b) Weltweite Distribution von Auszügen der HEMIS-Anwendung in München auf
CD-ROM in regelmäßigen, aktualisierten Editionen.
Beide System werden daher über unterschiedliche Benutzeroberflächen, Daten-
banken, etc. verfügen1
. Das System a) ist ein Produktionssystem, das im Wesent-
lichen nur von Mitarbeitern von UNEP/HEM genutzt wird. System b) soll helfen,
international über Umweltvorhaben zu informieren, Parallelentwicklungen zu
vermeiden sowie Grundinformationen über Projekte und Datenbanken zu liefern,
auch wenn die Informationen nicht in der Sprache des Benutzers vorliegen.
Die HEMIS-CD-ROM soll möglichst attraktiv gemacht werden, damit sie von vielen
benutzt wird und damit auch andere Institutionen, die nicht in das UN-Netz von
Organisationen eingebunden sind, Daten für das System liefern (Abb. 24).
INFOTERRA
H E M I S
Methods/
Models
Classification
Systems
Data-
bases
Programmes
Institutions
Persons
H i g h L e v e l D a t a M o d e l
ESA
EEA-TF
WMO
GEMS
IAEA Others
Governments
NGOs
UN
UNEP
EARTHWATCH

Examples of
sectoral / regional / specialized
sources of
environmental meta-data
Users


Harmonization and Distribution of Information via HEMIS
Abb. 24: Harmonisierung und Verteilung von Informationen mittels HEMIS. Daten auf Papier, Dis-
kette oder CD werden in das stationäre HEMIS eingelesen, selektiert und formatiert,
halbautomatisch oder manuell nach einer festgelegten Nomenklatur (Thesauri)
klassifiziert und anschließend als gedruckte Berichte zu bestimmten Themen oder als
CD-ROM distribuiert. Die Grafik zeigt nur eine Auswahl der beteiligten Organisationen.
Hauptkomponente beider HEMIS-Systeme (stationär und CD-ROM) sind mehrere
elektronische Thesauri, die in der Struktur Abb. 11, 12 und 25 folgen.
1HEMIS befindet sich Ende 1992 im Design- und Prototypstadium. Nicht alle Komponenten sind
bisher realisiert.ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 33 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
The Internal Structure of the HEMIS Thesaurus
A B C D E F G
Unique
Identifier
(ID)
IDs of prede-
cessors
(ISO TT, BT,
links)
IDs of followers
(ISO NT, links)
Main descriptor
for display in the
hierarchy of the
thesaurus
Position of “D”
in the hierarchy
Synonyms,
acronyms,
homonyms,
interpretations,
etc. of “D”
Explanation
Numeric
One entry
8 digits
Numeric
Up to 64 entries
8 digits
Sequence of
digits
Numeric
Up to 255 entries
8 digits
Sequence of
digits
Alpha- numeric
One entry
Up to 20
characters
(due to display
restrictions)
Numeric
One entry
Up to 8 digits
(max. of 8
hierarchy
levels)
Numeric
Up to 255 entries
Up to 40
characters each
sequence of
texts
Alpha- numeric
One entry
Up to 255
characters
Unique
reference key
for the
descriptor
database
Retrievable via
hierarchical
selection list
and
global search
Internal
management
Bi-
directional
Internal
mangement
Uni-
directional
For screen
display
in the
hierarchical
thesaurus
only
Retrievable
via
global search
Available
as context -
sensitive
help function
Abb. 25: Struktur der HEMIS-Thesauri für geographische Einheiten, Klimazonen, Sachgebiete
und andere hierarchisch strukturierte Schlüsselbegriffe. Erklärungen zu den einzelnen
Einträgen der ersten Zeile siehe Abschnitt 2.5 sowie Abb. 12).
Die Thesauri und Auswahllisten sind Bestandteil beider HEMIS-Systeme. Im statio-
nären System dienen sie zur Verschlagwortung von Datensätzen, Dokumenten,
Grafiken, Bildern, etc. sowie zur Suche und Kompilation von Daten. Werden Daten
in zuvor vereinbarten Formaten auf Datenträger angeliefert, so kann die Verschlag-
wortung teilweise automatisch per Programm erfolgen. In der CD-ROM-Version
dienen Thesauri, Auswahllisten und alle anderen Einträge nur zur Recherche und
Kompilation von Informationen.
Die HEMIS-CD-ROM-Version hat einen mehrschichtigen modularen Aufbau (vgl.
Abb. 26).
ONLINE ´93 Kongress IV
Seite 34 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
HEMIS-System Layout with Multi-Lingual User-interfaces
User Interface - (i.e. English)
Descriptor database
(field oriented database)
Hyper-
links
(part of
the
stored
objects)
Information retrieval and access system (IRAS)
Objects
Texts Images Datasets
Additional user interface in different languages
Standard variables
(alphanumeric,
numeric etc)
Numeric keys
related to thesauri and
selection lists
Database
of
guided
tour
links
Query by
example
Global
search
Thesauri
Selection lists
Guided
tours
Links language
translator
Abb. 26: HEMIS-System-Layout mit multilingualer Benutzerführung und Recherche. Die erste
Schicht wird von Benutzerschnittstellen in mehreren Sprachen gebildet. Darunter liegen
verschiedene Module für unterschiedliche Recherche- und Navigationsstrategien, die
ebenfalls sprachabhängig sind. Neben einer Datenbank verfügt HEMIS über vorbereitete
"Guided Tours" und "Links". Die Informationen und Dokumente auf der CD-ROM werden
von einem IRAS (Information Retrieval and Access System) verwaltet.
Neben der Suche nach bestimmten Schlagworten oder Begriffen bietet HEMIS
zusätzlich die Benutzung von zuvor zusammengestellten "Guided Tours" und indi-
viduelle "Links" als Navigationshilfen an. Eine übergreifende Suche über die Daten-
bank ("Global Search") ist zwar zeitaufwendig, erlaubt jedoch die Benutzung des
Systems ohne Kenntnis, was sich inhaltlich hinter einem Feld der Recherchemaske
verbirgt. Die Benutzeroberfläche kann zwischen verschiedenen ladbaren Sprachen
umgeschaltet werden. Gleiches gilt für Thesauri, Auswahllisten, Links und Guided
Tours. Freie Texteinträge und gescannte Dokumente werden nicht gewandelt.
HEMIS soll eine erste Information liefern, die dann bei den angegebenen Institu-
tionen, Datenbanken oder Publikationen vertieft werden kann.
Abb. 27 zeigt den vorgeschlagenen Startbildschirm des HEMIS-Prototypen mit den
Schaltflächen zum Einstieg in die Bildschirme der Hauptsachgebiete.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 35 von 37
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Start Screen of the HEMIS-Prototype
H E M I S
Environmental Information Sys temInstitutions
Programmes
Ref. Material
Methods
Databases
Ins titutions RegionDatabas es Methods Ref. Mat. LocationThes aurusG uided TourProgrammes
G uided Tours
Subject Thesaurus
Help
Region
Location
FrancaisEnglish Deutsch
Choos e Wählen SieChois ir
EXIT
?
Abb. 27: Haupt- oder Start-Bildschirm von HEMIS (vorgeschlagene CD-ROM-Version)
ONLINE ´93 Kongress IV
Seite 36 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
Dr. Ulrich Kampffmeyer
PROJECT CONSULT GmbH
Multilinguale Informations- und Retrievalsysteme
Technik und Anwendungsbeispiele
4. Ausblick
Multilinguale Informations- und Retrievalsysteme stehen erst am Beginn ihrer Ent-
wicklung.
Conclusions
MultiLingual Information and Retrieval Software
The European Challenge for 1993
Multi-lingual software is a must for all companies and organizations working
in different European Coutries
The American software industry is presently unable to supply multilingual software -
This is a window of opportunity for European software companies
Multilingual software helps to bridge the national barriers within Europe
Multilingual software is intelligent object-oriented programming
using databases and information management systems as a framework
for huge masses of coded and non-coded information
Abb. 28: Zusammenfassung wichtiger Argumente für multilinguale Software
Zusammenfassung (Abb. 28).
a) Multilinguale Software ist für alle Europa- oder Welt-weit agierenden Unterneh-
men nützlich, die sich nicht auf eine "Company Language" festlegen wollen.
b) Multilinguale Software ist in Ansätzen als Standardsoftware verfügbar (vgl.
HYPARCHIV, Abschnitt 3.1), muß in der Regel jedoch individuell angepaßt
werden (vgl. wfBase, Abschnitt 3.2 und HEMIS, Abschnitt 3.3).
c) Multilinguale Retrievalsoftware kann zur Erschließung großer Daten- und
Dokumentbestände auf digitalen optischen Speichern eingesetzt werden.
d) Multilinguale Thesauri fördern die Standardisierung bei der Klassifikation von
Dokumenten, erlauben einen eindeutigen und strukturierten Zugriff sowie
unterstützen die Recherche nach Dokumenten, die nicht in der Sprache des
Benutzers verfügbar sind.
e) Multilinguale Volltextretrieval- und -übersetzungssysteme befinden sich im
Probeeinsatz. Zusammen mit anderen Techniken wie Thesauri werden sie in
Zukunft einfach zu benutzende Informationssysteme ermöglichen.
f) Multilinguale Software ist eine Marktchance für europäische Software- und
Systemhäuser.
g) Multilinguale Retrieval- und Informationssysteme können in fast allen Wirt-
schafts- und Verwaltungsbereichen, die grenz- und kulturübergreifend arbeiten,
sinnvoll eingesetzt werden.
ONLINE ´93 Kongress IV
© Copyright PROJECT CONSULT GmbH 1992-1993 Seite 37 von 37

Mais conteúdo relacionado

Destaque

Conceptos de informatica
Conceptos de informaticaConceptos de informatica
Conceptos de informaticakimgio
 
Oracion maria en america
Oracion maria en americaOracion maria en america
Oracion maria en americavzevallos
 
25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto web25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto webwoko
 
Las materias que mas me gustan son
Las materias que mas me gustan sonLas materias que mas me gustan son
Las materias que mas me gustan sonjuanandrezruiz
 
Fundamentos de Google Adwords 2013
Fundamentos de Google Adwords 2013Fundamentos de Google Adwords 2013
Fundamentos de Google Adwords 2013woko
 
Células madre
Células madreCélulas madre
Células madreIrybez
 
Diseño de proyectos examen final diapositiva ssr
Diseño de proyectos examen final diapositiva ssrDiseño de proyectos examen final diapositiva ssr
Diseño de proyectos examen final diapositiva ssrEdith C. Moreno
 

Destaque (18)

Servifinanzas
ServifinanzasServifinanzas
Servifinanzas
 
[DE] Panel-Diskussion "Kampffmeyers Stammtisch" | DMS EXPO 2013
[DE] Panel-Diskussion "Kampffmeyers Stammtisch" | DMS EXPO 2013[DE] Panel-Diskussion "Kampffmeyers Stammtisch" | DMS EXPO 2013
[DE] Panel-Diskussion "Kampffmeyers Stammtisch" | DMS EXPO 2013
 
Conceptos de informatica
Conceptos de informaticaConceptos de informatica
Conceptos de informatica
 
Oracion maria en america
Oracion maria en americaOracion maria en america
Oracion maria en america
 
[DE] Email-Management | IBM Whitepaper | Ulrich Kampffmeyer | 2007
[DE] Email-Management | IBM Whitepaper | Ulrich Kampffmeyer | 2007[DE] Email-Management | IBM Whitepaper | Ulrich Kampffmeyer | 2007
[DE] Email-Management | IBM Whitepaper | Ulrich Kampffmeyer | 2007
 
[DE] Vom Web 2.0 zum Web 42.0 | Ulrich Kampffmeyer
[DE] Vom Web 2.0 zum Web 42.0 | Ulrich Kampffmeyer[DE] Vom Web 2.0 zum Web 42.0 | Ulrich Kampffmeyer
[DE] Vom Web 2.0 zum Web 42.0 | Ulrich Kampffmeyer
 
25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto web25 consejos para un buen posicionamiento SEO en tu proyecto web
25 consejos para un buen posicionamiento SEO en tu proyecto web
 
[DE] Records Management, Schriftgutverwaltung & Enterprise Search: Aktuelle E...
[DE] Records Management, Schriftgutverwaltung & Enterprise Search: Aktuelle E...[DE] Records Management, Schriftgutverwaltung & Enterprise Search: Aktuelle E...
[DE] Records Management, Schriftgutverwaltung & Enterprise Search: Aktuelle E...
 
Las materias que mas me gustan son
Las materias que mas me gustan sonLas materias que mas me gustan son
Las materias que mas me gustan son
 
Fundamentos de Google Adwords 2013
Fundamentos de Google Adwords 2013Fundamentos de Google Adwords 2013
Fundamentos de Google Adwords 2013
 
[DE] Dokumenten-Management Ist Infrastruktur | Dr. Ulrich Kampffmeyer | Hambu...
[DE] Dokumenten-Management Ist Infrastruktur | Dr. Ulrich Kampffmeyer | Hambu...[DE] Dokumenten-Management Ist Infrastruktur | Dr. Ulrich Kampffmeyer | Hambu...
[DE] Dokumenten-Management Ist Infrastruktur | Dr. Ulrich Kampffmeyer | Hambu...
 
[DE] Vom Wert der Information
[DE] Vom Wert der Information[DE] Vom Wert der Information
[DE] Vom Wert der Information
 
Células madre
Células madreCélulas madre
Células madre
 
La doma
La domaLa doma
La doma
 
Diseño de proyectos examen final diapositiva ssr
Diseño de proyectos examen final diapositiva ssrDiseño de proyectos examen final diapositiva ssr
Diseño de proyectos examen final diapositiva ssr
 
Mi proyecto artesanal
Mi proyecto artesanalMi proyecto artesanal
Mi proyecto artesanal
 
[DE] Enterprise Information Management & Output Management | inacta
[DE] Enterprise Information Management & Output Management | inacta[DE] Enterprise Information Management & Output Management | inacta
[DE] Enterprise Information Management & Output Management | inacta
 
[DE] Kampffmeyers Stammtisch DMS EXPO 2014
[DE] Kampffmeyers Stammtisch DMS EXPO 2014[DE] Kampffmeyers Stammtisch DMS EXPO 2014
[DE] Kampffmeyers Stammtisch DMS EXPO 2014
 

Semelhante a [DE] Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele | Dr. Ulrich Kampffmeyer | Hamburg 1993

PLM Open Hours - Mehrsprachigkeit
PLM Open Hours - MehrsprachigkeitPLM Open Hours - Mehrsprachigkeit
PLM Open Hours - MehrsprachigkeitIntelliact AG
 
Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]
Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]
Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]M-Way Consulting
 
Der richtige Weg zu multilingualem Wissensmanagement
Der richtige Weg zu multilingualem WissensmanagementDer richtige Weg zu multilingualem Wissensmanagement
Der richtige Weg zu multilingualem WissensmanagementSDL Language Technologies
 
Softwarelokalisierung
SoftwarelokalisierungSoftwarelokalisierung
SoftwarelokalisierungSchlafmuetz
 
Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...
Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...
Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...FLYACTS GmbH
 
ZüRich Ii Mobile App Final V3
ZüRich Ii Mobile App Final V3ZüRich Ii Mobile App Final V3
ZüRich Ii Mobile App Final V3guest08d4be
 
communicode referenz casestudy wilo
communicode referenz casestudy wilocommunicode referenz casestudy wilo
communicode referenz casestudy wilocommunicode AG
 
2008 - Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
2008 - Gewinnung von OPEN SOURCE Techniken für junge Unternehmen2008 - Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
2008 - Gewinnung von OPEN SOURCE Techniken für junge UnternehmenBjoern Reinhold
 
Ueberlegungen Projektmanagement Web Applications
Ueberlegungen Projektmanagement Web ApplicationsUeberlegungen Projektmanagement Web Applications
Ueberlegungen Projektmanagement Web ApplicationsGünther Haslbeck
 
Top 10 Internet Trends 2005
Top 10 Internet Trends 2005Top 10 Internet Trends 2005
Top 10 Internet Trends 2005Jürg Stuker
 
Archivierung von Web Applikationen bei der UBS
Archivierung von Web Applikationen bei der UBSArchivierung von Web Applikationen bei der UBS
Archivierung von Web Applikationen bei der UBSQumram
 
Multi-Channel-App - Erfolgsfaktoren einer Application
Multi-Channel-App - Erfolgsfaktoren einer ApplicationMulti-Channel-App - Erfolgsfaktoren einer Application
Multi-Channel-App - Erfolgsfaktoren einer ApplicationFLYACTS GmbH
 
Deutsche Wolke Präsentation 100114
Deutsche Wolke Präsentation 100114Deutsche Wolke Präsentation 100114
Deutsche Wolke Präsentation 100114Georg Klauser
 
Mit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichenMit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichenguest6e69c6b8
 
Mit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichenMit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichena3 systems GmbH
 

Semelhante a [DE] Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele | Dr. Ulrich Kampffmeyer | Hamburg 1993 (20)

PLM Open Hours - Mehrsprachigkeit
PLM Open Hours - MehrsprachigkeitPLM Open Hours - Mehrsprachigkeit
PLM Open Hours - Mehrsprachigkeit
 
Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]
Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]
Enterprise Mobility Plattformen – Aktuelle Lösungen und Trends [White Paper]
 
Der richtige Weg zu multilingualem Wissensmanagement
Der richtige Weg zu multilingualem WissensmanagementDer richtige Weg zu multilingualem Wissensmanagement
Der richtige Weg zu multilingualem Wissensmanagement
 
Softwarelokalisierung
SoftwarelokalisierungSoftwarelokalisierung
Softwarelokalisierung
 
Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...
Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...
Praxisleitfaden für Business Apps - Potenziale, Technologien, Kosten, Vorbere...
 
Mobile Endgeräte in der Produktion
Mobile Endgeräte in der ProduktionMobile Endgeräte in der Produktion
Mobile Endgeräte in der Produktion
 
ZüRich Ii Mobile App Final V3
ZüRich Ii Mobile App Final V3ZüRich Ii Mobile App Final V3
ZüRich Ii Mobile App Final V3
 
communicode referenz casestudy wilo
communicode referenz casestudy wilocommunicode referenz casestudy wilo
communicode referenz casestudy wilo
 
2008 - Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
2008 - Gewinnung von OPEN SOURCE Techniken für junge Unternehmen2008 - Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
2008 - Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
 
[DE] Information Lifecycle Management
[DE] Information Lifecycle Management[DE] Information Lifecycle Management
[DE] Information Lifecycle Management
 
Ueberlegungen Projektmanagement Web Applications
Ueberlegungen Projektmanagement Web ApplicationsUeberlegungen Projektmanagement Web Applications
Ueberlegungen Projektmanagement Web Applications
 
SOA in Kundenprojekten
SOA in KundenprojektenSOA in Kundenprojekten
SOA in Kundenprojekten
 
Top 10 Internet Trends 2005
Top 10 Internet Trends 2005Top 10 Internet Trends 2005
Top 10 Internet Trends 2005
 
Archivierung von Web Applikationen bei der UBS
Archivierung von Web Applikationen bei der UBSArchivierung von Web Applikationen bei der UBS
Archivierung von Web Applikationen bei der UBS
 
Multi-Channel-App - Erfolgsfaktoren einer Application
Multi-Channel-App - Erfolgsfaktoren einer ApplicationMulti-Channel-App - Erfolgsfaktoren einer Application
Multi-Channel-App - Erfolgsfaktoren einer Application
 
Deutsche Wolke Präsentation 100114
Deutsche Wolke Präsentation 100114Deutsche Wolke Präsentation 100114
Deutsche Wolke Präsentation 100114
 
TYPO3 Neos in der Praxis
TYPO3 Neos in der PraxisTYPO3 Neos in der Praxis
TYPO3 Neos in der Praxis
 
Delphi Firma Überblick
Delphi Firma ÜberblickDelphi Firma Überblick
Delphi Firma Überblick
 
Mit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichenMit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichen
 
Mit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichenMit dem Internet osteuropäische und asiatische Märkte erreichen
Mit dem Internet osteuropäische und asiatische Märkte erreichen
 

Mais de PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH

Mais de PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH (20)

[DE] Herausforderung Information Governance | Webinar "Mit ECM zu effektiver ...
[DE] Herausforderung Information Governance | Webinar "Mit ECM zu effektiver ...[DE] Herausforderung Information Governance | Webinar "Mit ECM zu effektiver ...
[DE] Herausforderung Information Governance | Webinar "Mit ECM zu effektiver ...
 
[DE] Die 10 PROJECT CONSULT Trends für das Information Management 2021 | Webc...
[DE] Die 10 PROJECT CONSULT Trends für das Information Management 2021 | Webc...[DE] Die 10 PROJECT CONSULT Trends für das Information Management 2021 | Webc...
[DE] Die 10 PROJECT CONSULT Trends für das Information Management 2021 | Webc...
 
[DE] Knowledge Management, eBusiness & Enterprise Content Management - Neue H...
[DE] Knowledge Management, eBusiness & Enterprise Content Management - Neue H...[DE] Knowledge Management, eBusiness & Enterprise Content Management - Neue H...
[DE] Knowledge Management, eBusiness & Enterprise Content Management - Neue H...
 
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
 
[EN] Decisions and Timing, a Practical Guide | Dr. Ulrich Kampffmeyer | PROJE...
[EN] Decisions and Timing, a Practical Guide | Dr. Ulrich Kampffmeyer | PROJE...[EN] Decisions and Timing, a Practical Guide | Dr. Ulrich Kampffmeyer | PROJE...
[EN] Decisions and Timing, a Practical Guide | Dr. Ulrich Kampffmeyer | PROJE...
 
[DE] Planung und Projektmanagement zur Einführung komplexer Informationssyste...
[DE] Planung und Projektmanagement zur Einführung komplexer Informationssyste...[DE] Planung und Projektmanagement zur Einführung komplexer Informationssyste...
[DE] Planung und Projektmanagement zur Einführung komplexer Informationssyste...
 
[DE] Zukünftige Entwicklungen im Information Management 2020 bis 2026 | Webca...
[DE] Zukünftige Entwicklungen im Information Management 2020 bis 2026 | Webca...[DE] Zukünftige Entwicklungen im Information Management 2020 bis 2026 | Webca...
[DE] Zukünftige Entwicklungen im Information Management 2020 bis 2026 | Webca...
 
[DE] Records Management | Dr. Ulrich Kampffmeyer | Saperion User Group | Berl...
[DE] Records Management | Dr. Ulrich Kampffmeyer | Saperion User Group | Berl...[DE] Records Management | Dr. Ulrich Kampffmeyer | Saperion User Group | Berl...
[DE] Records Management | Dr. Ulrich Kampffmeyer | Saperion User Group | Berl...
 
[DE] Workflow vom mainframe ins internet | Dr. Ulrich Kampffmeyer | Safe Tagu...
[DE] Workflow vom mainframe ins internet | Dr. Ulrich Kampffmeyer | Safe Tagu...[DE] Workflow vom mainframe ins internet | Dr. Ulrich Kampffmeyer | Safe Tagu...
[DE] Workflow vom mainframe ins internet | Dr. Ulrich Kampffmeyer | Safe Tagu...
 
[DE] „Aktuelles zu den rechtlichen Anforderungen an die Archivierung und Verf...
[DE] „Aktuelles zu den rechtlichen Anforderungen an die Archivierung und Verf...[DE] „Aktuelles zu den rechtlichen Anforderungen an die Archivierung und Verf...
[DE] „Aktuelles zu den rechtlichen Anforderungen an die Archivierung und Verf...
 
[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...
[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...
[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...
 
[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...
[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...
[DE] ECM 2.0 - die Zukunft dokumentbezogener Technologien | Ulrich Kampffmeye...
 
[DE] Digitalisierung & Information Management | Dr. Ulrich Kampffmeyer | Ceni...
[DE] Digitalisierung & Information Management | Dr. Ulrich Kampffmeyer | Ceni...[DE] Digitalisierung & Information Management | Dr. Ulrich Kampffmeyer | Ceni...
[DE] Digitalisierung & Information Management | Dr. Ulrich Kampffmeyer | Ceni...
 
[DE] Die 10 PROJECT CONSULT Trends für das Information Management 2020 | Web...
[DE]  Die 10 PROJECT CONSULT Trends für das Information Management 2020 | Web...[DE]  Die 10 PROJECT CONSULT Trends für das Information Management 2020 | Web...
[DE] Die 10 PROJECT CONSULT Trends für das Information Management 2020 | Web...
 
[DE] Sichere elektronische Archivierung | Felix von Bredow | AIIM Conference ...
[DE] Sichere elektronische Archivierung | Felix von Bredow | AIIM Conference ...[DE] Sichere elektronische Archivierung | Felix von Bredow | AIIM Conference ...
[DE] Sichere elektronische Archivierung | Felix von Bredow | AIIM Conference ...
 
[DE] Part 2 | E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...
[DE] Part 2 |  E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...[DE] Part 2 |  E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...
[DE] Part 2 | E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...
 
[DE] Part 1 | E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...
[DE] Part 1 |  E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...[DE] Part 1 |  E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...
[DE] Part 1 | E-Mail-Archivierung richtig gestalten – Rechtliche Grundlagen,...
 
[DE] "Effizienter Einsatz von Dokumenten-Technologie" | Dr. Ulrich Kampffmeye...
[DE] "Effizienter Einsatz von Dokumenten-Technologie" | Dr. Ulrich Kampffmeye...[DE] "Effizienter Einsatz von Dokumenten-Technologie" | Dr. Ulrich Kampffmeye...
[DE] "Effizienter Einsatz von Dokumenten-Technologie" | Dr. Ulrich Kampffmeye...
 
[DE] Optische Speicher, Voraussetzung für die Informationsverarbeitung der Zu...
[DE] Optische Speicher, Voraussetzung für die Informationsverarbeitung der Zu...[DE] Optische Speicher, Voraussetzung für die Informationsverarbeitung der Zu...
[DE] Optische Speicher, Voraussetzung für die Informationsverarbeitung der Zu...
 
[DE] Vom Wert der Information | Dr. Ulrich Kampffmeyer | DMS EXPO 2014
[DE] Vom Wert der Information | Dr. Ulrich Kampffmeyer | DMS EXPO 2014[DE] Vom Wert der Information | Dr. Ulrich Kampffmeyer | DMS EXPO 2014
[DE] Vom Wert der Information | Dr. Ulrich Kampffmeyer | DMS EXPO 2014
 

[DE] Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele | Dr. Ulrich Kampffmeyer | Hamburg 1993

  • 1. Multilinguale Informations- und Retrievalsysteme Dr. Ulrich Kampffmeyer, PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer VOI Verband Optische Informationssysteme, Roßdorf bei Darmstadt Vorsitzender des Vorstandes PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH Wachenheim, Hamburg, Darmstadt Abstract This paper on multilingual information and retrieval systems with optical mass storage describes the technical principles of software design. The different layers and modules from the user interface via transformation modules, thesaurus modules and fulltext interpretation to database management are explained in detail. Three examples of multilingual document imaging systems are presented: - HYPARCHIV multilingual standard optical filing software for Microsoft Windows and Novell Netware; - wfBase multilingual press and commerce information system base on four ISDN-knots in Switzerland; - HEMIS multilingual information system for CD-ROM distribution on environmental institutions, projects and programmes of the UN Environmental Programme UNEP/HEM. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 1 von 37
  • 2. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Gliederung Seite 1 Bedeutung multilingualer Softwaresysteme mit optischen Speichern für den europäischen Wirtschaftsraum ................................................................................................................... 4 2 Software-Design ................................................................................................................... 5 2.1. Struktur und allgemeine Anforderungen an multilinguale Software ....................................................................................................... 5 2.2 Benutzeroberfläche und Anwendung ....................................................................................................... 8 2.3 Transformationsmodule ....................................................................................................... 12 2.4 Auswahllisten ....................................................................................................... 14 2.5 Thesauri ....................................................................................................... 16 2.6 Volltextinterpretation ....................................................................................................... 21 3. Anwendungsbeispiele ................................................................................................................... 25 3.1 HYPARCHIV ....................................................................................................... 25 3.2 wfBase ....................................................................................................... 29 3.3 HEMIS ....................................................................................................... 31 ONLINE ´93 Kongress IV Seite 2 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 3. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele 4. Ausblick ................................................................................................................... 37 ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 3 von 37
  • 4. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH 1 Bedeutung multilingualer Softwaresysteme mit optischen Spei- chern für den europäischen Wirtschaftsraum Europa 1993 ist ein vielbenutztes Schlagwort. Auch nach Öffnung der Grenzen und Beseitigung der Handelshemmnisse bleiben sprachliche und kulturelle Barrieren bestehen. Diese betreffen alle unternehmen und Organisationen, die in verschiede- nen Ländern tätig sind. Die Sprachbarriere betrifft nicht nur die reine Sprachverstehen- und Sprach-über- setzungsebene, sondern schließt mehrere Ebenen unterschiedlicher Interpretation, Bedeutung in verschiedenen Zusammenhängen und Umsetzung in Fachnomenklatur ein. Im Wirtschaftsleben ist nicht die Umsetzung in die Umgangssprache sondern die Einhaltung "ungeschriebener" Gesetze der Fachsprache ausschlaggebend. Neben den unterschiedlichen sprachlichen Anforderungen sind Umrechnungen von Maßen und Währungen, Umstellungen von Formaten (Datum, Adresse, Schreib- weisen) etc. erforderlich. Multilinguale Software ist überall dort erforderlich, wo auf gleiche Information unab- hängig von der Art der Quelle zurückgegriffen werden muß. Dies betrifft insbeson- dere - Handelsunternehmen - Dienstleistungsunternehmen - internationale Behörden und Organisationen - Produktionsunternehmen mit Sublieferanten in unterschiedlichen Ländern - Kommunikationsunternehmen - Banken - Versicherungen - Kontrollinstitutionen (Flugsicherung / Polizei / Katastrophenschutz / Umweltdaten) - etc. Vielerorts wird die englische Sprache als Standard für die Kommunikation erachtet. Die Benutzung einer Fremdsprache kann jedoch zu Fehlinterpretationen führen, wenn die genaue Bedeutung von Begriffen und Zusammenhängen nicht bekannt ist. Umgangssprachkenntnisse sind hier nicht ausreichend. Je komplexer Software und die zugrunde liegenden Informationen werden, desto komfortabler und umfassender muß die Unterstützung durch das Programm werden. Dies betrifft insbesondere Anforderungen an die Gestaltung der Benutzeroberfläche, Mitteilungen zur gegenwärtigen Aktion, Zustands-meldungen, kontextsensitive Hinweise (besonders bei Fehlbedienung oder kritischen Programmverzweigungen) sowie Hilfetexte. Letztere müssen als Index wie auch kontextsensitiv zur Verfügung stehen. Moderne "Windows"-orientierte Programme verfügen in der Regel über diese Eigen- schaften. Wie die meisten Programme sind sie jedoch nur in einer Benutzersprache gehalten. ONLINE ´93 Kongress IV Seite 4 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 5. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Standardsoftware wird heute hauptsächlich von wenigen großen Softwarehäusern in den USA hergestellt. Dies bedeutet,daß Software und Dokumentation zunächst in Englisch oder in amerikanischem Englisch vorliegen. Von dieser Ursprungsversion ausgehend werden verschiedene nationale Versionen erstellt. In Abhängigkeit von der Bedeutung eines Marktes liegen diese mehr oder weniger verzögert in unter- schiedlichen Release-Ständen vor. In einem solchen Standardprogramm sind häufig die Bildschirm-darstellungen, zugehörige Texte etc. im Hauptteil des Programms enthalten. Dies macht eine Übersetzung mit Anpassung der Darstellung und zusätz- lichen Tests sehr aufwendig. Auch wenn auf die gleichen Daten zugegriffen werden kann, ist ein Wechsel der Benutzersprache während der Laufzeit nicht möglich, sondern das anderssprachige Programm muß zeitaufwendig komplett geladen werden. Auch verfügen die meisten Standardprograme über keine integrierte Datenbank oder Ressourcen-Management- Komponente, die die Verwaltung der verschiedenen Sprach- und Funktionsmodule, sogar deren Erstellung und Pflege erleichtern würden. Herkömmliche Standardsoftware ist daher bereits aus Design-Gesichtpunkten nicht multilingual ausgelegt. Der vorliegende Artikel beschäftigt sich mit multilingualen Informationssystemen, die auf einer Datenbank basieren. 2 Software-Design Multilingualität muß ebenso wie das modulare Zuladen von Programmteilen oder Funktionen bereits beim Entwurf eines Programms berücksichtigt werden. Die nach- trägliche Umstellung einer vorhandenen Software ist kaum möglich. In einem solchen Fall eis ein komplettes Redesign unter Einsatz moderner Tools sinnvoller. 2.1. Struktur und allgemeine Anforderungen an multilinguale Software Multilinguale Software folgt folgenden Designkriterien (Abb. 1): a) Modulares Design mit klarer logischer und programmtechnischer Trennung der verschiedenen Ebenen (Benutzerschnittstelle, Hauptprogramm, Ressourcen, Transformations-Module, Datenbank, etc.) Die Interaktion wird über Nachrich- ten (Messages) und globale Variablen gesteuert. b) Keine Textkomponente darf in ausführenden Programmteilen enthalten, son- dern muß über Variable referenziert sein. Die Umschaltung von einer Sprache zur anderen erfolgt über ein globale Variable. c) Die Texte werden strukturiert in Ressource-Libraries (Bibliotheken) gehalten und werden über Variablen aufgerufen. Diese Bibliotheken müssen einfach zu pflegen und die Texte zur Laufzeit aufrufbar sowie in der Applikation ladbar sein. d) Alle Teile einer Anwendung müssen über definierte Schnittstellen verfügen. Dies betrifft insbesondere die Benutzerschnittstelle, die eigentliche Applikation und das Betriebssystem sowie die Zusatzmodule der Applikation. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 5 von 37
  • 6. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH e) Applikation, Benutzerschnittstelle und Betriebssystem müssen variable Text- feldlängen und -positionen unterstützen. Diese können in Abhängigkeit der gewählten Sprache unterschiedlich sein. f) Applikation, Betriebssystem, Bildschirm- und Druckertreiber sowie die Daten- bank müssen unterschiedliche Fonts, Zeichensätze, Sortierungen, Datums- formate, etc. unterstützen. Voraussetzung ist die Eignung des Betriebssystems. Multilingual Software - Design Principles Modular design with clear separation of user interface, operating system and application (database) Every text component has to be referenced by a key variable in the application Resource libraries easy to link and to maintain (i.E. text editor) Defined interfaces between the user interfaces, operating system and application modules Variable textfield positions and field-lengths in the user interface modules of the application Support of different sets of fonts, language specific characters, keyboard layouts, date formats etc. by the underlying operating system Abb. 1: Designkriterien multilingualer Software Die multilinguale Anwendung gliedert sich dementsprechend in verschiedene Module und Ebenen, die miteinander kommunizieren (Abb. 2). Das eigentliche Anwendungsprogramm, das Teil der Datenbankanwendung sein kann, steuert über Nachrichten und globale Variable die Wahl einer Sprache, deren Anzeige (und Druck) sowie die eigentlichen Recherche- und Umwandlungsfunktionen. ONLINE ´93 Kongress IV Seite 6 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 7. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Principles of Language Display during Runtime Screen Text Field German English French Spanish Language Resources Please select ... Application Resource Data Data- base Selection Lists Thesauri Trans- formation Modules The language selector (Lx) in the application defines which resource is used for display and how the information in the datafield is represented Screen LX LX LX Abb. 2: Sprachanzeige während der Laufzeit des multilingualen Programmes Die Variable "Lx" für "Language Resource" bestimmt, welche Texte angezeigt und welche Transformationsmodule und Auswahllisten benutzt werden, um eine Eingabe oder eine Recherche in der angewählten Sprache zu steuern. Die Information in der Datenbank selbst wird nicht verändert, nur Anzeige und Ausdruck werden umge- setzt. Die verschieden Schichten einer multi-lingualen Anwendung sind auf Abb. 3 darge- stellt. Language Resources Trans- formation Modules Selection Lists Thesauri Language Interpreter User interface (Windows, Presentation Manager, X-Windows, etc.) Database User interface (Application) Application Operating System IRS Information Resources Management Driver 4 1 2 3 Layers and Modules of Multi-Lingual Software ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 7 von 37
  • 8. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Abb. 3: Schichten (1-4) und Module multilingualer Software Schicht 1 beinhaltet im wesentlichen die Darstellung der Informationen, Schicht 2 dient zur Transformation der angezeigten Informationen von einer Sprache in eine andere, Schicht 3 verwaltet die Zugriffsinformationen und dient zur Recherche, Schicht 4 verwaltet die "Dokumente" (Datensätze, Bilder, Grafiken etc.) auf opti- schen Speichermedien. Auf die letztgenannte Schicht 4, das IRS Information Resources Management Programm soll in diesem Artikel nicht näher eingegangen werden (vergleiche hierzu Kampffmeyer, Ulrich; "Kombinierte WORM- und magneto- optische Massenspeicher und vorgangsorientierte Informationsverarbeitungs- systeme", GI Gesellschaft für Informatik, Arbeitskreis "Datenbanken", Tagung am 19.2.1990, Universität Oldenburg, 1990). Die einzelnen Ebenen und die darin ent- haltenen Komponenten werden im Folgenden erläutert. 2.2 Benutzeroberfläche und Anwendung Die Benutzeroberfläche ist in starkem Maße von dem darunterliegenden Betriebs- system abhängig. Viele Betriebssysteme werden den Anforderungen für multi- linguale Software nicht gerecht, da sie zur Laufzeit nicht umkonfigurierbar sind und keine internationalen Zeichensätze sowie Formate unterstützen. Für multilinguale Anwendungen sind Betriebssysteme mit einer grafischen Benutzeroberfläche wie Microsoft Windows, OS/2 Presentation Manager oder Oberflächen, die auf XWindows basieren (OSF Motif, OpenLook u.a.) gut geeignet. Sie gestatten die Kontrolle der Bildschirmanzeige weitgehend unabhängig vom eigentlichen Betriebs- system. Es ist grundsätzlich zwischen a) der Standard-Windows-Oberfläche und b) der auf Basis dieser Oberfläche realisierten anwendungsspezifischen Benutzeroberfläche zu unterscheiden. Letztere benutzt die Mittel, die von der Standardoberfläche bereitgestellt werden, um die Funktionen der Applikation darzustellen. Eine grafische Oberfläche bietet zahlreiche Vorteile: Vom verringerten Lernaufwand, integrierte Hilfefunktionen bis zur einfachen Benutzerführung, die wahlweise über Mausaktionen, Anwahl aus Menüleisten oder Tastaturkombinationen steuerbar ist. Ein besonderer Vorteil von Windows-Oberflächen ist die frei skalierbare Größe von Fenstern und anderen Anzeigen. Es ist wenig sinnvoll für multilinguale Anwendungen alle Anzeigen in der Applikation mit einer eigenen Benutzeroberfläche zu realisieren, da dies die Zahl der einsetz- baren Bildschirm- und Druckertreiber einschränkt. Die Benutzeroberfläche der Applikation sollte soweit möglich auf Standardroutinen der Windows-Oberfläche zurückgreifen. ONLINE ´93 Kongress IV Seite 8 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 9. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele An die Benutzeroberfläche (Standard-Windows und Anwendungsoberfläche) sind folgende Anforderungen zu stellen (Abb. 4 und 5): a) Umschaltbarkeit der Tastaturbelegung während der Laufzeit gesteuert durch die Applikation b) Umschaltbarkeit der Bildschirmdarstellung während der Laufzeit gesteuert durch die Applikation c) Anzeigemöglichkeit von spezielle Zeichensätzen (z.B. Deutsch: ä, ö, ü, ß; Französisch: é, è, ê, ç; Spanisch: Í; Dänisch: Ø, å, Æ; Ungarisch: ÿ, ý, ï; Griechisch: α, β, χ; etc.) d) Umschaltbarkeit von Formaten während der Laufzeit (z.B. Datum, Währung, Zeit, etc.) e) Automatische Anpassung der Anzeige am Bildschirm in Bezug auf unterschied- liche Textlängen, Sonderzeichen, Fonts, etc. Die Anpassung muß in Abhängig- keit der verfügbaren Bildschirmauflösung durchführbar sein. f) Sprachabhängige, kontextsensitive Hilfe in Abhängigkeitder Position auf dem Bildschirm, des aktuellen Programmzustandes und der durchgeführten oder durchführbaren Aktion. g) Zuladbare Module während der Laufzeit, ohne das Programm zu verlassen. Operating System and User Interface Requirements for European Software The operating system and Window Interface must support several features to enable switching the language during runtime Change of keyboard setting and screen display during runtime via external program Enhanced keyboard setting with special characters: European languages ( ç, ê, æ, å, ø ,ä , etc. ). Support and change during runtime of date and time formates Graphic Interface with virtual Window architecture to allow different sizes of screens and fields while changing the language Context-sensitive help in relation to the actual position of the cursor Abb. 4: Betriebssystem und Benutzerschnittstelle ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 9 von 37
  • 10. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH User Interface (application) Requirements The user interface has to support several functions to enable change of language during runtime Object oriented software Change of screens, settings and styles during runtime Dynamic positioning of fields Automatic adaption of different field lengths Controllable by the application program Loadable modules during runtime for messages, windows and helptexts Dynamic data and message interchange with operation system and user interface, application program and database Abb. 5: Benutzerschnittstelle Wichtigstes Merkmal einer multilingualen Anwendung ist die Umschaltbarkeit während der Programmausführung, ohne daß ein anderes Programm geladen und gestartet werden muß und ohne daß sich der Bildschirmaufbau und angezeigten Informationen (inhaltlich) ändern (Abb. 4). Die einzelnen Textkomponenten werden in separaten Dateien gehalten, sog. "Resource Libraries" (Abb. 2). Diese werden zur Laufzeit in Abhängigkeit der Sprachenwahlvariable "Lx" geladen. Vorausbedingung für die Benutzung von Sprachressourcen ist, daß alle Texte in einem Programm, die angezeigt oder gedruckt werden sollen, durch eine eindeutige Schlüsselvariable mit der zugehörigen Bibliothek referenziert sind (Abb. 2). "Resource Libraries" werden benötigt für: a) alle statischen Textanzeigen auf einem Bildschirmformular ("Statische" Anzei- gen sind Texte wie Beschriftungen, die sich erst beim Wechsel des Bildschirm- formulars ändern). Dies sind Texte, die in der Regel mit einem bestimmten Bildschirmformular fest verbunden sind. b) dynamische Textanzeigen auf dem Bildschirmformular, die sich in Abhängigkeit des Zustandes verändern oder einblenden (Messages). Hierzu gehört auch das "Ausgrauen" von nicht aktiven oder auswählbaren Funktionen auf dem Bildschirmformular (Schaltflächen) und in Menüauswahllisten. c) Hilftexte, die automatisch erscheinen oder interaktiv abgerufen werden (Helptexts). ONLINE ´93 Kongress IV Seite 10 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 11. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele d) Fehlermeldungen, Systemmeldungen und andere Hinweismeldungen, die aktionsbezogen erscheinen. Language Resources Requirements Language resources are used for displaying texts related to the unique keys in the application Loadable modules for each language Every entry in the language resource is referenced by a unique key which may be used by different applications and the database itself Language resources are needed for Every text on a entry or search screen form Every message Every helptext Icons adapted for each country Editor or tools for translation support Abb. 6: Sprachressourcen Viele Anwendungen benutzen Icons (Sinnbilder) und Schaltflächen zur verein- fachten Anwahl von Funktionen. Sind sie mit Texten versehen oder durch Buchstaben (als Abkürzung) gekennzeichnet, so müssen auch diese Icons bei einem Sprachwechsel umgeschaltet werden. Es empfiehlt sich daher, auch die Sinnbilder in eigenen Ressourcen-Bibliotheken zu halten und nicht direkt im Programm zu verwalten. Gleiches gilt auch für Icons mit Grafiken, wenn die Grafik Dinge zeigt, die in einem anderen Sprachraum oder Land, nicht mit der gezeigten Funktion des Icons verknüpft werden. Objektorientierte Programmiersprachen und Datenbanken unterstützen häufig die Benutzung von ladbaren Ressourcen und sind deshalb herkömmlichen Tools vorzu- ziehen. Für die Erstellung der eigentlichen Anwendung, die sich auf eine Programmier- sprache oder eine Datenbankprogrammiersprache stützen kann, ist die Wahl des geeigneten Tools wichtig. Die Anwendung stellt die übergreifende und integrative Komponente im gesamten System dar (vgl. Abb. 2 und Abb. 7). Die Applikation beinhaltet nicht nur die üblichen Algorithmen zur Datenverarbeitung und Module für Ein- und Ausgabe, sondern ebenfalls die Steuerung und Auswahl der Sprach- ressourcen (Transformationsmodule, Auswahllisten, Thesauri, Hilfetexte, Mitteilun- gen und Hinweistexte, Bildschirmaufbau und -anzeige, etc.). ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 11 von 37
  • 12. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Application Characteristics Object oriented message driven program Direct control of database and user interface Numeric keys for every text entry related to the screen display and database fields Transformatters, selection lists, thesauri, language interpretors and language resources as loadable modules Database as loadable module or server-client-communication via SQL Abb. 7: Anwendungskomponente Objektorientierte Programme mit einem "Message"- Konzept, wie es z.B. Microsoft Windows beinhaltet, erlauben die ständige Kontrolle über die verwendeten Ressour- cen und den Zustand der Bildschirmanzeigenzeige. Für die Kontrolle der Module auf Ebene 2 (vgl. Abb. 3) sollte eine direkte Kommunikation aufgebaut werden. Für die Kommunikation mit der Datenbank, in der die eigentlichen Information verwaltet und gehalten wird, kann SQL als standardisierte Kommunikationsschnittstelle benutzt werden. Alle Module der Schichten 2, 3 und 4 (vgl. Abb. 3) sollten während der Laufzeit direkt aufrufbar oder zuladbar sein. 2.3 Transformationsmodule Die numerischen Informationen in der Datenbank werden in einem Format abgelegt, daß bei Bedarf für eine bestimmte zugeladene Sprachressource gewandelt wird. Diese Wandlung wird ebenfalls durch die Variable "Lx" gesteuert (Abb. 2). Trans- formationsmodule sind wesentlich einfacher als Textübersetzer zu realisieren, da sie nach genauen Regeln und nur mit numerischen Werten arbeiten (Abb. 8). ONLINE ´93 Kongress IV Seite 12 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 13. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Transformation Modules Types Transformation modules are used for the display transfomation of numeric values of the database Transformation of date formates Transformation of time formates Transformation of addresses Transformation of units of measure Transformation of international standardized nomenclature Transformation of user-defined values (supported by operating system) (supported by operating system) (position of postal codes, etc. ) (litre to gallon, km to mile, etc. ) (country and city names, etc. ) (see selection lists, etc. ) Abb. 8: Transformationsmodule Die wichtigsten Standard-Transformationsmodule sind: a) Datumsformatumwandlung Dieses Modul wandelt die Anzeige zwischen amerikanischen (Monat-Tag, Jahr) und europäischen (Tag-Monat-Jahr) Format um. Diese Funktion wird häufig direkt vom Betriebssystem unterstützt und erlaubt auch die volle oder abgekürzte Verwendung des Monatnamens. Das Transformationsmodul sollte auch für die Umwandlung von Datumsformaten vor dem Jahr 2000 auf das neue Jahrtausend hin ausgelegt sein. Dies ist wichtig für alle Datenbestände mit Aufbewahrungspflichten von 7 Jahren und mehr. Das Datum-Transfer- Modul muß ebenfalls für die richtige Sortierung bei der Anzeige sorgen. b) Zeitformatumwandlung Ähnliches wie für die Datumsformate gilt für die Transformation von Zeiten und deren Anzeige. Für international agierende Unternehmen empfiehlt sich die Speicherung von Zeitdaten im "coordinated universal time"-Format (UTC). Datum- und Zeittransformationsmodule können so ausgelegt werden, daß sie prüfen, ob die interne Zeiteinstellung des Systems korrekt ist (das aktuelle Datum/Zeit muß immer jünger sein als das zuletzt gespeicherte Dokument; Abgleich mit Standard-Arbeitszeiten und Werktagen; etc., um gegebenenfalls des Ausfall der Systemzeit festzustellen und zu melden). c) Adressen-Transformation Die Adressenformat-Transformation betrifft mehr den Ausdruck als die Anzeige am Bildschirm. Postanschriften sind in Europa nicht standardisiert und benutzen unterschiedliche Reihenfolgen von Straße, Hausnummer und Post- leitzahlen. Das Transformationsmodul erkennt, welches Land bei einem Anschreiben gewählt ist und stellt für den Druck das richtige Adressformat ein. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 13 von 37
  • 14. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH d) Transformation von Werten Für international tätige Handels- und Produktionsunternehmungen stellt die Transformation von Maß-, Entfernungs- und anderen Werten eine wichtige Anforderung dar. Dies soll an einem Beispiel erläutert werden: In der Mineralölindustrie werden täglich große Mengen unterschiedlicher Ölsor- ten und Ölprodukte transportiert und zwischengelagert. Je nach Art, Gewicht und Temperatur ändern sich Werte sowie davon abhängig Zoll- und Steuer- sätze. Besonders bei grenzüberschreitendem Verkehr ist daher eine Umwand- lung in die landesüblichen Einheiten erforderlich. Zu den wichtigsten umrechenbaren Werten gehören Währungen sowie Entfer- nungs-, Gewichts- und Hohlmaße. e) EDI-Daten Der standardisierte elektronische Datenaustausch (EDI - Electronic Data Interchange), z.B. EDIFACT, erlaubt die Abwicklung kompletter Geschäfts- transaktionen auf elektronischem Wege. Hierbei entstehen keine Papier- originale mehr. Die Daten sind digital zu archivieren. Für die Anzeige und den Ausdruck werden EDI-Codes in Texte umgesetzt. Diese Umsetzung in Klartext kann durch eine Sprachsteuervariable ebenfalls sprachabhängig gemacht wer- den. Bei EDI-Informationen ist zu berücksichtigen, mit welcher Version einer bestimmten EDI-Anwendung die Daten zu transformieren sind. Entsprechend verschiedener branchenspezifischer Anforderungen an eine Applika- tion können weitere Transformationsmodule hinzukommen. Hierzu gehören z.B. die Umsetzung von Produktcodes in Klartext. 2.4 Auswahllisten Grafische Oberflächen wie Microsoft Windows unterstützen einfache (single select) und mehrfach (multiple select) Auswahllisten (Abb. 9). Bei den erstgenannten Aus- wahllisten kann aus der angezeigten Liste nur ein Eintrag markiert und übernommen werden. Bei multiplen Auswahllisten können einer oder mehrere Einträge markiert und übernommen werden. ONLINE ´93 Kongress IV Seite 14 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 15. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Selection Lists Characteristics Selection lists are an easy way to translate information and to spare storage capacity The list displays a text on the screen related to a database value Every entry in a selection list refers to a value which is related to a database field Every entry in the different language versions of a list refers to the same value The database has to store only the numeric value of the entry Selection lists help to standardize nomenclature in multinational and multilingual organizations Selection lists can be used as single and multiple-choice lists Abb. 9: Auswahllisten Auswahllisten bieten bei Datenbankanwendungen eine Reihe von Vorteilen gegen- über Standard-Texteingabefeldern: a) Auswahllisten vermeiden Tippfehler. b) Auswahllisten sorgen für die Vereinheitlichung der Datenbank und stellen sicher, daß ein eingegebener Eintrag eindeutig wiedergefunden wird. Sie sor- gen für eine standardisierte Eingabe, bei der sich der Benutzer für einen bestimmten Begriff entscheiden muß. c) Bei Auswahllisten wird in der Datenbank nur eine Referenzziffer zu einer Text- ressource gespeichert. Dies erfordert wenig Platz, kann in Abhängigkeit einer Sprachanwahlvariable auf unterschiedliche Textressourcen verzweigen und beschleunigt das Retrieval der Datenbank, da nur vordefinierte Ziffern und keine Textsequenzen durchsucht werden müssen. d) Multiple Auswahllisten erleichtern die Mehrfachzuordnung eines Dokumentes und gestatten dem Anwender bei unsicherer Zuordnung zu nur einem Begriff die zusätzliche Anwahl weiterer verwandter Begriffe. Für multilinguale Anwendungen ist besonders die Option c) von Bedeutung. Sie erlaubt durch die Verwendung von Referenznummern die Zuweisung zu mehreren Listen in unterschiedlichen Sprachen. Weiterhin können die Referenznummern auch für den Zugriffschutz benutzt werden, indem nur zulässige Begriffe bei einer Recherche angezeigt werden. Auswahllisten erleichtern auch die Erfassung von Informationen durch Voreinstellungen für häufig wiederkehrende Einträge. Auswahllisten können mit Standard-Texteditoren erstellt werden. Dies sollte jedoch nur von bestimmten autorisierten Personen geschehen, da Änderungen und beson- ders Löschungen von Einträgen Merkmalen (Einträge in einer Auswahlliste) die ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 15 von 37
  • 16. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Datenbankkonsistenz gefährden können. Bei verteilten Systemen und Ressourcen ist die Einhaltung von strengen Update- und Pflegerichtlinien unerläßlich. Auswahllisten mit kontrolliertem Wortschatz sind das geeignete Medium zur Standardisierung der Nomenklatur in Unternehmen und zur Schaffung multilingualer Softwaresysteme. Multilinguale Systeme sollten die freie Texteingabe nach Möglich- keit vermeiden und Auswahllisten - wo immer sinnvoll und einsetzbar - verwenden. 2.5 Thesauri Der Begriff "Thesaurus" wird sehr unterschiedlich benutzt. Ursprünglich steht er für eine definierte Fachnomenklatur, die hierarchisch vom Grobem zum Feinen heruntergebrochen ist. Die Begriffe sind in der Bedeutung von einander eindeutig unterschieden und in mehreren Hierarchieebenen gegliedert, wobei mehrere Begriffe auf einer unteren Hierarchieebene einem inhaltlich übergreifendem Begriff auf der nächst höheren Ebene zugeordnet sind. Begriffe auf einer Ebene sollten einen ähnlichen Detaillierungsgrad haben. In vielen aus den USA kommenden Textverarbeitungsprogrammen wird der Begriff "Thesaurus" für eine Hilfsfunktion zur Wahl geeigneter Synonyme benutzt. Diese Art Thesaurus hat nichts mit der strukturierten Nomenklatur zu tun, wie sie z.B. durch die International Standardization Organization (ISO) für einfache und multilinguale Thesauri festgelegt ist. Thesauri Thesauri offer a hierachical structured and crosslinked nomenclature One field on the screen may be represented by a structured hierarchical thesaurus Similar to a selection list, the thesaurus displays a text related to a database value related with this text The thesaurus offers navigation and interpretation tools The Thesaurus is a database of itself which relates numeric values to texts and provides additional structure by hierarchic order and crosslinks The structure of thesauri is standardized by ISO The same thesaurus may be used by different applications Abb. 10: Thesauri ONLINE ´93 Kongress IV Seite 16 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 17. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Die hier behandelten Thesauri für multilinguale Programmsysteme verhalten sich nach außen ähnlich wie Auswahllisten (Abb. 10; vgl. auch Abb. 9). Es wird zunächst eine Liste mit den Oberbegriffen angezeigt (ISO Top Term; TT). Bei der Anwahl eines Oberbegriffs wird eine zweite Auswahlliste mit den zugeordneten Unter- begriffen angezeigt (ISO Narrower Term; NT). Wird hier ein Begriff ausgewählt, so bildet dieser den Oberbegriff (ISO Broader Term; BT) für die nächste Ebene von Unterbegriffen (vgl. Abb. 11). Diese strenge Hierarchie ist auf die wenigsten Sach- gebiete voll anwendbar. Der ISO-Standard sieht deshalb auch sogenannte "Crosslinks" vor. Diese setzen Begriffe auf unterschiedlichen Ebenen und Verzwei- gungen unabhängig von der Position in der Hierarchie zueinander in Beziehung. Dies läßt sich mit einem Programmsystem einfacher als in gedruckter Form nach- bilden. Ein elektronischer Thesaurus wird programmintern ebenfalls durch Referenz- nummern abgebildet (vgl. Auswahllisten). Im Gegensatz zu Auswahllisten sind einem Eintrag im Thesaurus zusätzlich zum "unique Identifier" (eindeutige Schlüsselnummer, die in der Datenbank gespeichert wird) die Anzeigeposition (auf welche Ebene und Verzweigung in der hierarchischen Darstellung der Eintrag ange- zeigt werden soll) und die Art (gegebenenfalls auch Art und Richtung) einer Verbindung als Merkmale zugeordnet. Die Verbindungen erlauben die Zuordnung eines Begriffes zu mehreren Oberbegriffen anderer Zweige wie auch die Zuordnung als Oberbegriff zu verschiedenen Unterbegriffen in anderen Verzweigungen unabhängig von der Position innerhalb der Hierarchie. Die Verwendung unterschied- licher Links (uni-direktional, bi-direktional, broad-to-narrow, narrow-to-broad, additional reference, synonym, etc.) macht die Navigation in einem solchem System einfacher. Im Prinzip stellt ein elektronischer Thesaurus eine eigene Datenbank- anwendung dar, die zwischen Benutzeroberfläche und eigentlicher Datenbank geschaltetet ist. In der Datenbankanwendung wird nur der "Unique Identifier" abgespeichert. Ist dieser mit einem "Narrower Term" referenziert, können über die Verbindungen und die Position in der Hierarchie alle zum Begriff gehörigen Oberbegriffe und der "Top Term" erschlossen werden. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 17 von 37
  • 18. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Thesauri Hierarchy and Crosslinks The Hierarchical View of the Thesaurus (Top Term, Broader Term, Narrower Term) The Network Structure of the Thesaurus (Crosslinks independent of the hierarchical position) 7 6 5 4 3 21 7 6 8 4 3 21 1220 1210 1120 1110 1200 11001000 1220 1210 1120 1110 1200 11001000 Unique identifier Position in hierarchical view Abb. 11: Hierarchie und von virtuelle Verbindungen (Crosslinks) Ein elektronischer Thesaurus wird intern als Netzwerk abgebildet (relationales System), nach außen aber als Hierarchie präsentiert. Die Zusammenstellung einer Liste von Begriffen ist daher nicht nur vom Oberbegriff, sondern auch von den Ver- bindungen und dem Weg, auf dem man zum Oberbegriff gelangt ist, abhängig. Im Gegensatz zu Auswahllisten können Listenanzeigen eines elektronischen Thesaurus je nach Situation unterschiedlich zusammengesetzt sein. Neben der Navigationshilfe durch die Anzeige der Auswahllisten in Abhängigkeit eines zuvor gewählten Oberbegriffs kann ein Datenbank-gestützter Thesaurus auch in unterschiedlichen "Spezialisten"- und "Anfänger"-Modi benutzt werden. Bei der Erfassung von Informationen ist ein "Spezialisten"-Modus sinnvoll, bei dem ein Unterbegriff oder ein Kürzel direkt eingegeben werden kann und die Datenbank selbsttätig die dazugehörigen Oberbegriffe ohne Durchlaufen der Hierarchie ermittelt. Bei einer Recherche durch Benutzer, die keine Erfahrung mit hierarchischen Auswahllisten oder mit dem sachlichen Inhalt des Thesaurus haben, ist ein "Anfänger"-Modus sinnvoll, bei dem die Texteingabe des Benutzers analysiert, auf einen "Match" im Thesaurus durchsucht wird und im Zweifelsfall durch Hinzuziehung von Synonym-Listen und Hilfetexten eine Empfehlung zur Wiederholung oder Konkretisierung der Anfrage angezeigt wird. Eine solche "Global Search" kann auch über weitere Felder oder andere zum Thesaurus gehörende Ressourcen durchgeführt werden. ONLINE ´93 Kongress IV Seite 18 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 19. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Abb. 12 zeigt, wie mehrere "Scheiben" den eindeutigen Schlüsselvariablen der Thesaurus-Datenbank zugeordnet sind. Jede der Sprachscheiben enthält auch alle Informationen, wie die Begriffe hierarchisch und vernetzt angeordnet sind, da die Ordnung von Sprache zu Sprache verschieden sein kann (Begriffsunschärfen, feinere oder gröbere Unterteilungen). Unabhängig von den Differenzen in der Sprache muß aber immer die gleiche Information eindeutig auffindbar sein. Neben dem eigentlichen Begriff (Main Keyword) sind deshalb auch Acronyme (Abkürzungen aus den Anfangsbuchstaben von zusammengesetzten Begriffen oder Namen), Homonyme (gleichlautende Begriffe unterschiedlichen Inhalts), Synonyme (anderslautende Begriffe ähnlichen oder gleichen Inhalts), Pluralformen des Begriffs, etc. sowie eine erklärende Hilfe dem "Unique Identifier" zugeordnet. Bei einer "Global Search" werden diese mitdurchsucht. In einer solchen "Sprachscheibe" muß jedoch nicht unbedingt eine Fremdsprache enthalten sein, es können auch unterschiedliche Ressourcen in einer Landes- sprache benutzt werden. Dies ist sinnvoll, wenn es sich um Fachinformationen handelt. So kann z.B. in einer "Scheibe" die umgangssprachliche Information ent- halten sein, die nur zwei bis drei Ebenen enthält und Nicht-Fachspezialisten zugänglich ist, und in einer zweiten "Scheibe" die Fachnomenklatur fein aufge- gliedert in weiteren Ebenen, die nur dem Fachmann zur Verfügung steht. Damit läßt sich auch Umfang, Tiefe und Zugriff zur Information steuern. Thesauri "Slice"- Model of a Multilingual Thesaurus ID´s dec ID´s dec German Language "Slice" ID´s dec ID´s of pre- decessors ID´s of suc- cessors position in hierarchy main key wordn synonyms, ho- monyms etc. ID´s dec ID´s of suc- cessors position in hierarchy main key wordn synonyms, ho- monyms etc. Unique ID A1 Unique ID A2 Unique ID A3 Unique ID An ... ID´s of pre- decessors ID´s of suc- cessors position in hierarchy ... ... ID´s of pre- decessors main key wordn synonyms, ho- monyms etc. help text help text help text French Language "Slice" ID´s of suc- cessors position in hierarchy main key wordn synonyms, ho- monyms etc. help text ID´s of pre- decessors help text English Language "Slice" help text help text ID´s of pre- decessors ID´s of suc- cessors position in hierarchy main key wordn synonyms, ho- monyms etc. ID´s of pre- decessors ID´s of suc- cessors position in hierarchy main key wordn synonyms, ho- monyms etc. ID´s of pre- decessors ID´s of suc- cessors position in hierarchy main key wordn synonyms, ho- monyms etc. help text ID´s of pre- decessors ID´s of suc- cessors position in hierarchy main key wordn synonyms, ho- monyms etc. Abb. 12: "Scheiben"-Struktur eines multilingualen Thesaurus ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 19 von 37
  • 20. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Der Nutzen einer elektronischen Thesaurus-Datenbank neben der modularen "Scheiben"-Struktur für multilinguale Anwendungen ist vielfältig: a) Standardisierter, kontrollierter Wortschatz sichert das eindeutige und voll- ständige Wiederfinden aller korrekt erfaßten Informationen. b) Eingabefehler werden vermieden. c) Auswahllisten und Hilfefunktionen erleichtern die Navigation durch umfang- reiche und tiefgegliederte Fachnomenklatur. d) Funktionen wie "Global Search" erlauben die Suche auch im Synonym-, Homonym-, Acronym- und anderen Verweiseinträgen sowie im Hilfetext selbst. e) Aufbau und Struktur von Thesauri sind international standardisiert. f) Eine Thesaurus-Datenbank arbeitet als "Pre-Processor" und spart Zeit bei der Suche in der eigentlichen Datenbank, da nur noch kurze, eindeutige numerische Referenzen durchsucht und ausgewertet werden. Die Umsetzung der Schlüsselzahlen für die Anzeige erfolgt wiederum durch den Thesaurus. g) Thesaurus-Datenbanken können auf PC-Rechnern in einem Netzwerk lokal betrieben werden und entlasten damit als "Pre-Processor" die zentrale Daten- bank und das Information Resources Management (IRS; siehe unten und Abb. 3). Wird zusätzlich zur Thesaurus-Datenbank und zur eigentlichen Datenbank eine Verwaltungssoftware zur Ansteuerung optischer Systeme eingesetzt, so ergibt sich eine dreistufige Datenbankhierarchie (vgl. Abb. 3 und Abb. 26): a) Datenbank für einen oder mehrere Thesauri (lokal oder zentral) b) Datenbank zur Verwaltung von Schlüsselzahlen zu Auswahllisten und Thesauri sowie von standard Datenbankeinträgen (numerisch, alphanumerisch, Datum, Zeit, boole´sche Variable, etc.) c) Information-Retrieval-and-Access-System (IRAS). In der Regel eine Non- Standard-Datenbank zur Verwaltung nur einmal beschreibarer WORM-Medien, wiederbeschreibarer optischer Speicher (Erasable, Rewritable, M/O) oder nur lesbarer Speicher (CD-ROM). Für eine Thesaurus-Datenbank kann ebenso wie für die eigentliche Anwendung eine Standard-Datenbank eingesetzt werden (vorzugsweise eine relationale Datenbank). Volltext-Datenbanken sind für diese Art der Anwendung nicht geeignet (Abb. 13). ONLINE ´93 Kongress IV Seite 20 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 21. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Database Characteristics Support of optical disk information retrieval system for mass data management Standard relational database may be used to manage data (except for language interpretation) Standard fulltext database are not usable Abb. 13: Merkmale für das Datenbanksystem 2.6 Volltextinterpretation Die elektronische Interpretation und Übersetzung von Volltext folgt gänzlich anderen Strategien als die bisher beschriebenen Techniken. Transfomationsmodule, Aus- wahllisten und Thesauri lassen sich beliebig kombinieren und in einem System ver- einigen, da sie alle nach der gleichen Regel arbeiten: numerische Kennziffern werden nach festgelegten Regeln eindeutig in vordefinierte, kontrollierte Begriffe oder andere Werte umgesetzt. Ein System, das die Analyse von Volltext erlaubt, ist nur schwer mit den vorge- nannten Modulen zu kombinieren. Es ist ein eigenständiges komplexes Software- system, das sich aus verschiedenen Komponenten zusammensetzt (Abb. 14 und 15): ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 21 von 37
  • 22. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Language Interpreter Characteristics The language interpreter contains different modules which allow translation and interpretation of fulltext databases. Dictionaries provide information for the direct translation of nouns (singular, plural, conjunctions, etc.) Statistical modules support the interpretation of the noun inside a text Linguistic modules support the interpretation of the grammatical context Comparision modules combine the different strategies of interpretation Presentation modules display the answer of a query in the chosen language as translated fulltext Inverted file and cache modules optimize access Abb. 14: Merkmale eines Sprachinterpretationssystems Language Interpreter Structure Presentation Modules Linguistic Modules Statistic Modules Dictionaire Modules User Interface Entry Query Comparision Inverted File Database Display Language Interpreter ONLINE ´93 Kongress IV Seite 22 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 23. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Abb. 15: Struktur eines Sprachinterpretationssystems a) Wörterbuchkomponenten beinhalten die einzelnen Worte in verschiedenen Formen (Plural, Singular, Konjugation, Deklination, irreguläre Verben, etc.) Das Wörterbuch stellt in der Regel eine eigene Datenbankanwendung dar. Es ist jedoch grundverschieden in Struktur, Aufbau und Inhalt des zuvor diskutierten Thesaurus. b) Statistik-Module analysieren das Vorkommen und die Zusammensetzung von Worten und Wortkombinationen. c) Linguistik- und Grammatik-Analyse-Module stellen den am schwierigsten zu realisierenden Teil dar. Sie beinhalten alle Regeln und Vergleichsbeispiele für die Analyse der Syntax. Hierfür werden häufig Techniken der Mustererkennung (Pattern Recognition) und Fuzzy Logic eingesetzt. d) Die Ergebnisse der drei Module a), b) und c) werden in einem Vergleichsmodul zusammengeführt, gewertet und interpretiert. Das Vergleichsmodul ist so konzipiert, daß es Zwischenergebnisse eines Moduls zur Auswertung an ein anderes Modul zurückgeben kann. So entsteht ein iterativer Prozeß mit einer relativ hohen Erkennungsrate bei fachbezogenen Texten, für die es spezielle elektronische Wörterbücher mit der Fachnomenklatur gibt. e) Da herkömmliche Datenbanken aufgrund ihrer Architektur mit der zeitinten- siven Volltextauswertung wenig effektiv sind, werden häufig spezielle "Cache"- und "Inverted File"-Module zwischengeschaltet. f) Präsentations- oder Darstellungsmodule sorgen für die korrekte Wiedergabe der übersetzten Texte am Bildschirm. Sie werden mit Informationen aus dem Wörterbuchmodul, dem ausgewerteten Text aus der Datenbank und dem "Inverted File"-System gespeist. Das beschriebene Volltextinterpretationssystem kann zur Auswertung von Klartext- Anfragen benutzt werden. In Abb. 15 ist der Bearbeitungsweg für eine Anfrage dargestellt. Bei der Umsetzung eines Textes aus der Datenbank werden die Module in gleicher Weise von unten nach oben durchlaufen. Die vorgestellte Lösung stellt nur eine mögliche Konfiguration dar. Da diese Technik sehr neu ist, werden auch zahlreiche andere Ansätze verfolgt. Der hier vorgestellte Ansatz hat den Vorzug, daß zugleich verschiedene Module mit unterschiedlichen Auswertungsstrategien durchlaufen werden. Jedes Modul kann zudem auf bestimmte Sprachen oder Fach- nomenklaturen spezialisiert und bei Bedarf automatisch vom Vergleichsmodul zuge- schaltet werden. Die Interpretation und Übersetzung eines Textes ist sehr zeitauf- wendig und in der Regel nur auf schnelle Dialog-Rechnern möglich. Komplexe Systeme wie das beschriebene sollten nicht mit einfachen Übersetzungshilfen verwechselt werden. Herkömmliche Volltextdatenbanken sind für solche Systeme selten geeignet. Die Strategie bei Standarddatenbanksoftware ist, Füllworte, Adjektive, Adverbien etc. wegzulassen, um Speicherplatz zu sparen, sowie die Geschwindigkeit der Daten- bank zu erhöhen. Bei einem sprachinterpretierenden System werden jedoch alle Informationen des Textes benötigt, da ansonsten keine zusammenhängende und kontextbezogene Übertragung möglich ist. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 23 von 37
  • 24. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Erste Erfolge mit dem Einsatz von "Language-Interpreter"-Datenbank-Systemen wurden bei der UNO und der Europäischen Kommission erzielt. Die Wahl einer Strategie für multilinguale Datenbankanwendungen ist heute noch einfach: a) Für Dokument-orientierte (Faksimile) Systeme, Anwendungen mit kontrollier- tem Wortschatz und Systeme, die zu einer Standardisierung der Benutzung führen sollen, ist der Ansatz mit Transformations-, Auswahllisten- und Thesaurus-Modulen zu wählen. b) Für Anwendungen im Volltextbereich, die nicht innerhalb der nächsten drei bis vier Jahre in den Produktionsbetrieb gehen sollen, ist die Erprobung oder Beschäftigung mit dem hier beschriebenen Ansatz sinnvoll. Kommerziell nutzbare, sofort einsatzfähige Standardsoftware existiert zur Zeit weder für a), noch für b). Auch in Zukunft ist nicht mit "Off-the-shelf"-Lösungen zu rechnen, da die Art der Anwendung und die zu verwendende Nomenklatur immer Änderungen erfordern wird. Ideal ist jedoch nach Meinung des Verfassers ein Ansatz, wie er in Abb. 3 dargestellt ist. Hier sind die verschiedenen Umsetzungs- und Interpretationskomponenten in einer Schicht zusammengefaßt und arbeiten parallel. Sie verbinden die Benutzer- oberfläche mit der eigentlichen Datenbank. Ein solcher integrativer Ansatz verbindet die Vorzüge aller genannten Techniken, die in einer Anwendung nach Bedarf einzeln oder kombiniert eingesetzt werden können. ONLINE ´93 Kongress IV Seite 24 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 25. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele 3. Anwendungsbeispiele Anhand von drei Beispielen sollen multilinguale Informations- und Retrievalsysteme anwendungsorientiert erläutert werden: Abb. 16: Anwendungsbeispiele a) HYPARCHIV Standard "Document-Imaging"-Software für Microsoft Windows b) wfBase Presse- und Wirtschaftinformationen in einem verteilten "Document-Imaging"-System c) HEMIS Umweltinformationen auf CD-ROM 3.1 HYPARCHIV HYPARCHIV ist ein vollständig in Deutschland entworfenes und programmiertes Archivierungssystem für Faksimile-Dokumente und Dateien. HYPARCHIV wird als Einzelplatz- und als Netzwerkversion in allen wichtigen europäischen Sprachen angeboten. Es unterstützt zahlreiche Scanner, Drucker, "Image-Boards" und optische Speicher (WORM, M/O, Jukeboxen). Weitere Module erlauben die auto- matische Indizierung von Dateien (COLD), Faxversendung und Empfang, Daten- austausch mit externen Datenbanken, Dokumentenaustausch zwischen ver- schiedenen HYPARCHIV-Systemen und zusätzliche Datensicherung (Krypto- graphische Kodierung). Zur einfachen Generierung von Anwendungen existiert ein "WYSIWIG"-Editor. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 25 von 37
  • 26. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Die Auswahl der Beispiele aus einer Vielzahl anderer erfolgte auf Basis der vom Autor selbst durchgeführten Projekte. Als Marketing- und Sales-Manager sowie Systemberater der ACS Systemberatung GmbH war der Verfasser von 1989 - 1992 für Design, Entwicklung und Vermarktung von HYPARCHIV, sowie in den Jahren 1990 - 1992 für das Design und Projektmanagement von wfBase verantwortlich. Seit 1990 betreut der Verfasser das HEMIS-Projekt. HYPARCHIV European standard for PC-based optical filing software Optical filing software for Microsoft Windows 3.1 supporting various scanners, printers, optical disks and jukeboxes Novell Netware 3.11 Server-client-architecture, object-oriented design Triple Access: Hierarchy with icons, relational database and hyperlinks Multi-lingual user interface, available in English, US-English (with icons for Folders, Cabinets, etc.), French, German, Dutch, Swedish, Greek, Hungarian, Spanish, Portuguese, etc. User interface, messages and help switchable during runtime Selections in different languages locally available, but not direct multi-lingual database support (multi-lingual thesaurus available in1993 with new server / client solution) ACS Systemberatung GmbH, Germany Abb. 17: Merkmale von HYPARCHIV Das Programm besitzt eine grafische Benutzeroberfläche, die Ordnungsmittel und Funktionen ikonisiert darstellt. HYPARCHIV gestattet mehrere frei kombinierbare Zugriffs- und Informationsverwaltungstechniken: a) Hierarchische Ordnung mit Aktenschränken, Ordnern, Mappen, etc. b) Datenbank, formulargesteuert mit "Query by Example" (QBE). HYPARCHIV unterstützt mehrere Anwendungen gleichzeitig mit Umschalten der Datenbank während der Laufzeit. c) Hyperlinks zur virtuellen Verbindung von Objekten (Notizen, Ordnungsmittel, Dokumente und Dateien) ONLINE ´93 Kongress IV Seite 26 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 27. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Abb. 18: Der grafische "elektronische Schreibtisch" von HYPARCHIV (angewählte Sprache: Deutsch) HYPARCHIV unterstützt die Multilingualität nur an der Benutzeroberfläche: Menues, Hilfetexte, Meldungen, Ikonen, Knöpfe, Dokumentbeschriftungen, etc. werden während der Laufzeit durch eine einfache Menu-Anwahl umgeschaltet. Der "elektronische Schreibtisch" und der Zustand des Systems ändert sich nicht. Die komplette Systemumschaltung dauert ca. 2 Sekunden inklusive Anpassung aller Texte, Fenster und Ikonen auf dem Bildschirm. Für Datenbankmasken (Bildschirm- formular) können mit Einschränkungen Arbeitsplatz-bezogen auch verschiedene Auswahllisten hinterlegt werden, die auf die numerischen Schlüssel des gleichen Datenbankfeldes referenzieren. Dadurch ist eine eingeschränkte Multilingualität auch für die HYPARCHIV-Datenbank gegeben. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 27 von 37
  • 28. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Abb. 19 zeigt eine dreisprachige Pressearchivanwendung. Hier sind auf der Daten- bankmaske die Texte in allen drei Sprachen angegeben. Die Schaltfelder "Documentation", "Press review" und "Bibliography" verzweigen auf Untermasken. Hinter den Feldern "Sachgebiet" und "Schlagworte" liegen Auswahllisten, die lokal in jeweils einer der drei Sprachen vorgehalten werden. Alle anderen Feldinhalte werden nicht übersetzt und erscheinen in der Eingabesprache. Abb. 19: Dreisprachige Datenbankmaske einer Pressearchivanwendung für HYPARCHIV Von HYPARCHIV ist inzwischen auch eine Client-Server-Version mit einem multi- lingualen Thesaurus verfügbar. Die letztgenannte Version wird jedoch nicht als Standardprodukt vertrieben. Die verfügbare Standardversion HYPARCHIV NET für Novell-Netzwerke wird in Europa bereits mehr als 200 mal eingesetzt. Von der Einzelplatz- und der STARTER-Version wurden mehrere tausend verkauft. HYPARCHIV hat sich damit zum europäischen Standard für Windows-basierte "Optical-Filing"-Systeme entwickelt. ONLINE ´93 Kongress IV Seite 28 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 29. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele 3.2 wfBase wfBase ist eine individuelle Applikation, die für die Schweizer Wirtschaftsförderung (wf) entwickelt worden ist. wfBase befindet sich seit 1992 im Produktionsbetrieb. Die Zentrale der Schweizer Wirtschaftsförderung (wf) ist in Zürich. Außenstellen befinden sich in Genf, Bern und Lugano. Vor der Einführung von wfBase wurden an allen vier Orten Dossiers über politische Ereignisse, Wirtschaftsdaten, etc. unabhängig von einander geführt. Ziel von wfBase ist, allen internen Benutzern Zugriff auf Presseartikel, Zeitschriften und selbst erzeugtes Schriftgut unabhängig von der Eingabesprache zu ermöglichen (vgl. Abb. 20 und 21). wfBase wf Schweitzer Wirtschaftsförderung Swiss Institute for Commercial Development Zürich - Geneva - Bern - Lugano The wf owns one of the largest archives on commercial and political topics in Switzerland. It provides information to politicians, journalists and its commercial members representing all major companies of Switzerland. Optical filing system for press and commercial documents (scanned and created via word processor, sreadsheet, etc. ) Distributed system linked via SwissNet 2 (ISDN) Access for wf-employees and third-party partners via multilingual graphic user interface (ISDN and telephone modem) Database with 4-lingual thesaurus Access to information independent of the language in which it was entered Several million documents stored on M/O-Jukeboxes (2 times 50 gigabyte) Integrated bureau communication with textprocessing, spreadsheet, FAX, library management, electronic mail, accounting, address database, etc. Abb. 20: wfBase - Ausstattung und Merkmale ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 29 von 37
  • 30. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH wfBase Storage and Communications Layout Harddisk Cache Zürich Images, Files & Descriptors Read / Write / Create Harddisk Cache Lugano Images, Files & Descriptors Read / Create Harddisk Cache Geneva Images, Files & Descriptors Read / Create Harddisk Cache Bern Images, Files & Descriptors Read / Create wf-User wf-User wf-User wf-User Jukebox External Use Jukebox Internal Use DB Server Zürich Archive - Server Zürich Communications - Server Zürich External User Harddisk Cache Addresses Library Dossiers ISDN Telephone Modem& ISDN SwissNet 2 ISDN SwissNet 2 ISDN SwissNet 2 Novell Netware Abb. 21: wfBase - Systemkonfiguration mit internen und externen Teilnehmern sowie Informations- verwaltung in zwei Jukeboxen (Zürich) wfBase integriert unter seiner grafischen Oberfläche auch andere Anwendungen zusätzlich zur Dokumentenverwaltung. Hierzu gehören Textverarbeitungs- und Spreadsheet-Anwendungen, Adress- und Bibliotheksverwaltung, Abrechnung für externe Nutzer des Systems, elektronischer Faxeingang und -ausgang, elek- tronische Posteingangs- und Ausgangskörbe, etc. wfBase benutzt Module von HYPARCHIV, ist im Übrigen aber eine eigenständige Anwendung mit Client-Server- Architektur und einer relationalen Datenbank auf einem OS/2-Server. Die Arbeitsplätze unter Microsoft Windows sind in einem Novell-Netzwerk zusammengeschlossen. Außer den internen Nutzern können auch Dritte sich in wfBase über Modem einwählen, Dokumente ("Subset") abfragen, lokal anzeigen und drucken oder per Fax sich senden lassen. Die vier Standorte der wf sind über Hochleistungs-SwissNet2 (ISDN) miteinander verbunden (vgl. Abb. 21). Dies erlaubt auch die Übermittlung von komprimierten gescannten Faksimiles. In zwei Jukeboxen sind neben gescannten Faksimiles auch selbst erzeugte Dateien und eingegangene Faxmitteilungen gespeichert. Das System ist weitgehend fehlertolerant und ausfallsicher ausgelegt. Kernstück von wfBase ist die Datenbank mit einem viersprachigen Thesaurus für die Sachgebiets-Klassifikation (Deutsch, Französisch, Italienisch und Englisch). Der Thesaurus beinhaltet über 2.000 Sachgebiete, die hierarchisch und in einer Link- Struktur in vier Ebenen gegliedert sind. ONLINE ´93 Kongress IV Seite 30 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 31. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele wfBase Multilingual Thesaurus The two images show different views of the thesaurus for thematic keywords (here in German). The thesaurus supports the user in navigation, jump-functions, short-key-entries, synonym-retrieval and other techniques for easy-to-use access. Screen I aus Vortrag Online ´92 Thesaurus-Maske Sachgebiet für Vortrag auf Folie einkleben Screen II aus Vortrag Online ´92 Thesaurus-Maske Sachgebiet für Vortrag auf Folie einkleben Abb. 22: wfBase - multilingualer Thesaurus. Die Abbildung zeigt zwei Fenster der Bildschirmdar- stellung des Thesaurus. Links ist angezeigt, wie von einem Oberbegriff auf eine Liste von Unterbegriffen verzweigt wurde. Der Thesaurus beinhaltet die in den Dossiers erfaßten Sachgebiete Neben dem Thesaurus existieren Auswahllisten für andere Felder sowie Text- und Dateneingabefelder. Mit der Datenbank können die Dokumente unabhängig von der Sprache, in der sie erfaßt wurden, gefunden werden. Die Anzeige erfolgt jedoch in derjenigen Sprache, in der das Dokument erzeugt wurde. In einem multilingualen Staat wie der Schweiz ist die Übersetzung des Inhaltes nicht erforderlich. Ziel von wfBase ist vielmehr die Kommunikation zwischen den wf-Standorten zu verbessern, Adress- und Dokumentenbestände zu vereinheitlichen, Redundanzen abzubauen und Dritten (Mitgliedern der wf-Trägerschaft) einen einfachen, Zeit- und Kosten- sparenden Zugriff zu erlauben. 3.3 HEMIS ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 31 von 37
  • 32. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Die Vereinten Nationen haben im Rahmen ihrer Umweltorganisation (United Nations Environmental Programme - UNEP) eine Instituion zur Harmonisierung von Umwelt- meßmethoden, -vorhaben, -projekten und -informationen gegründet (UNEP/HEM - Harmonization of Environmental Measurement). Im Münchner Büro von UNEP/HEM wird seit 1990 ein Projekt zur Schaffung eines Informations- und Meta-Daten- banksystems durchgeführt (HEMIS - HEM Informations System). HEMIS soll in Bezug auf Umweltforschung, Umwelt-"Monitoring" und Umweltschutz einen Über- blick über a) Laufende Projekte im globalen und nationalen Umfang der UN, anderer inter- nationaler und großer nationaler Organisationen im Umweltbereich, b) Institutionen, Forschungsschwerpunkte, Periodika und leitende Mitarbeiter, c) Methoden, Referenzmaterialien, etc., d) Datenbanken, Datenformate, Datenqualität, Zugang, etc. geben (vgl. Abb. 27). Die in HEMIS enthaltenen Informationen sind Meta-Daten, die aus den unterschiedlichsten Quellen kompiliert werden (vgl. Abb. 23 und Abb. 27). HEMIS UNITED NATIONS ENVIRONMENTAL PROGRAMME HARMONIZATION OF ENVIRONMENTAL MEASUREMENT UNEP / HEM, Nairobi / Munich The UNEP / HEM Office harmonizes nomenclature, measurements and other information used worldwide in environmental projects. This task will be supported in the future by the HEMIS meta-database and information system, a multilingual CD-ROM using PC-system. Multilingual thesauri for scientific nomenclature, countries, climates, etc. with references, links, synonyms, homonyms, acronyms and wildcard-functionalitity Harmonization of nomenclature by standardized access to Information Hyperlinks, guided tours, global search facilities together with the thesaurus enable easy access to the Information independent of the language of entry CD-ROM based worldwide distribution Abb. 23: HEMIS - Informations- und Meta-Datenbanksystem der UN Umweltorganisation UNEP/HEM Ziel ist die Harmonisierung des Zugriffs auf heterogene Informationen unterschied- licher Qualität, verschiedenen Umfangs und aus diversen Quellen. Das HEMIS hat zwei Systemkomponenten: ONLINE ´93 Kongress IV Seite 32 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 33. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele a) In München wird ein System installiert werden, mit dem alle Informationen gesammelt, aufbereitet, inhaltlich erschlossen und verwaltet werden. Das System soll in der Lage sein, aus seiner Datenbank heraus selektierte Berichte (printouts) und CD-ROM-Datenbanken zu erstellen. b) Weltweite Distribution von Auszügen der HEMIS-Anwendung in München auf CD-ROM in regelmäßigen, aktualisierten Editionen. Beide System werden daher über unterschiedliche Benutzeroberflächen, Daten- banken, etc. verfügen1 . Das System a) ist ein Produktionssystem, das im Wesent- lichen nur von Mitarbeitern von UNEP/HEM genutzt wird. System b) soll helfen, international über Umweltvorhaben zu informieren, Parallelentwicklungen zu vermeiden sowie Grundinformationen über Projekte und Datenbanken zu liefern, auch wenn die Informationen nicht in der Sprache des Benutzers vorliegen. Die HEMIS-CD-ROM soll möglichst attraktiv gemacht werden, damit sie von vielen benutzt wird und damit auch andere Institutionen, die nicht in das UN-Netz von Organisationen eingebunden sind, Daten für das System liefern (Abb. 24). INFOTERRA H E M I S Methods/ Models Classification Systems Data- bases Programmes Institutions Persons H i g h L e v e l D a t a M o d e l ESA EEA-TF WMO GEMS IAEA Others Governments NGOs UN UNEP EARTHWATCH  Examples of sectoral / regional / specialized sources of environmental meta-data Users   Harmonization and Distribution of Information via HEMIS Abb. 24: Harmonisierung und Verteilung von Informationen mittels HEMIS. Daten auf Papier, Dis- kette oder CD werden in das stationäre HEMIS eingelesen, selektiert und formatiert, halbautomatisch oder manuell nach einer festgelegten Nomenklatur (Thesauri) klassifiziert und anschließend als gedruckte Berichte zu bestimmten Themen oder als CD-ROM distribuiert. Die Grafik zeigt nur eine Auswahl der beteiligten Organisationen. Hauptkomponente beider HEMIS-Systeme (stationär und CD-ROM) sind mehrere elektronische Thesauri, die in der Struktur Abb. 11, 12 und 25 folgen. 1HEMIS befindet sich Ende 1992 im Design- und Prototypstadium. Nicht alle Komponenten sind bisher realisiert.ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 33 von 37
  • 34. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH The Internal Structure of the HEMIS Thesaurus A B C D E F G Unique Identifier (ID) IDs of prede- cessors (ISO TT, BT, links) IDs of followers (ISO NT, links) Main descriptor for display in the hierarchy of the thesaurus Position of “D” in the hierarchy Synonyms, acronyms, homonyms, interpretations, etc. of “D” Explanation Numeric One entry 8 digits Numeric Up to 64 entries 8 digits Sequence of digits Numeric Up to 255 entries 8 digits Sequence of digits Alpha- numeric One entry Up to 20 characters (due to display restrictions) Numeric One entry Up to 8 digits (max. of 8 hierarchy levels) Numeric Up to 255 entries Up to 40 characters each sequence of texts Alpha- numeric One entry Up to 255 characters Unique reference key for the descriptor database Retrievable via hierarchical selection list and global search Internal management Bi- directional Internal mangement Uni- directional For screen display in the hierarchical thesaurus only Retrievable via global search Available as context - sensitive help function Abb. 25: Struktur der HEMIS-Thesauri für geographische Einheiten, Klimazonen, Sachgebiete und andere hierarchisch strukturierte Schlüsselbegriffe. Erklärungen zu den einzelnen Einträgen der ersten Zeile siehe Abschnitt 2.5 sowie Abb. 12). Die Thesauri und Auswahllisten sind Bestandteil beider HEMIS-Systeme. Im statio- nären System dienen sie zur Verschlagwortung von Datensätzen, Dokumenten, Grafiken, Bildern, etc. sowie zur Suche und Kompilation von Daten. Werden Daten in zuvor vereinbarten Formaten auf Datenträger angeliefert, so kann die Verschlag- wortung teilweise automatisch per Programm erfolgen. In der CD-ROM-Version dienen Thesauri, Auswahllisten und alle anderen Einträge nur zur Recherche und Kompilation von Informationen. Die HEMIS-CD-ROM-Version hat einen mehrschichtigen modularen Aufbau (vgl. Abb. 26). ONLINE ´93 Kongress IV Seite 34 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 35. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele HEMIS-System Layout with Multi-Lingual User-interfaces User Interface - (i.e. English) Descriptor database (field oriented database) Hyper- links (part of the stored objects) Information retrieval and access system (IRAS) Objects Texts Images Datasets Additional user interface in different languages Standard variables (alphanumeric, numeric etc) Numeric keys related to thesauri and selection lists Database of guided tour links Query by example Global search Thesauri Selection lists Guided tours Links language translator Abb. 26: HEMIS-System-Layout mit multilingualer Benutzerführung und Recherche. Die erste Schicht wird von Benutzerschnittstellen in mehreren Sprachen gebildet. Darunter liegen verschiedene Module für unterschiedliche Recherche- und Navigationsstrategien, die ebenfalls sprachabhängig sind. Neben einer Datenbank verfügt HEMIS über vorbereitete "Guided Tours" und "Links". Die Informationen und Dokumente auf der CD-ROM werden von einem IRAS (Information Retrieval and Access System) verwaltet. Neben der Suche nach bestimmten Schlagworten oder Begriffen bietet HEMIS zusätzlich die Benutzung von zuvor zusammengestellten "Guided Tours" und indi- viduelle "Links" als Navigationshilfen an. Eine übergreifende Suche über die Daten- bank ("Global Search") ist zwar zeitaufwendig, erlaubt jedoch die Benutzung des Systems ohne Kenntnis, was sich inhaltlich hinter einem Feld der Recherchemaske verbirgt. Die Benutzeroberfläche kann zwischen verschiedenen ladbaren Sprachen umgeschaltet werden. Gleiches gilt für Thesauri, Auswahllisten, Links und Guided Tours. Freie Texteinträge und gescannte Dokumente werden nicht gewandelt. HEMIS soll eine erste Information liefern, die dann bei den angegebenen Institu- tionen, Datenbanken oder Publikationen vertieft werden kann. Abb. 27 zeigt den vorgeschlagenen Startbildschirm des HEMIS-Prototypen mit den Schaltflächen zum Einstieg in die Bildschirme der Hauptsachgebiete. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 35 von 37
  • 36. Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Start Screen of the HEMIS-Prototype H E M I S Environmental Information Sys temInstitutions Programmes Ref. Material Methods Databases Ins titutions RegionDatabas es Methods Ref. Mat. LocationThes aurusG uided TourProgrammes G uided Tours Subject Thesaurus Help Region Location FrancaisEnglish Deutsch Choos e Wählen SieChois ir EXIT ? Abb. 27: Haupt- oder Start-Bildschirm von HEMIS (vorgeschlagene CD-ROM-Version) ONLINE ´93 Kongress IV Seite 36 von 37 © Copyright PROJECT CONSULT GmbH 1992-1993
  • 37. Dr. Ulrich Kampffmeyer PROJECT CONSULT GmbH Multilinguale Informations- und Retrievalsysteme Technik und Anwendungsbeispiele 4. Ausblick Multilinguale Informations- und Retrievalsysteme stehen erst am Beginn ihrer Ent- wicklung. Conclusions MultiLingual Information and Retrieval Software The European Challenge for 1993 Multi-lingual software is a must for all companies and organizations working in different European Coutries The American software industry is presently unable to supply multilingual software - This is a window of opportunity for European software companies Multilingual software helps to bridge the national barriers within Europe Multilingual software is intelligent object-oriented programming using databases and information management systems as a framework for huge masses of coded and non-coded information Abb. 28: Zusammenfassung wichtiger Argumente für multilinguale Software Zusammenfassung (Abb. 28). a) Multilinguale Software ist für alle Europa- oder Welt-weit agierenden Unterneh- men nützlich, die sich nicht auf eine "Company Language" festlegen wollen. b) Multilinguale Software ist in Ansätzen als Standardsoftware verfügbar (vgl. HYPARCHIV, Abschnitt 3.1), muß in der Regel jedoch individuell angepaßt werden (vgl. wfBase, Abschnitt 3.2 und HEMIS, Abschnitt 3.3). c) Multilinguale Retrievalsoftware kann zur Erschließung großer Daten- und Dokumentbestände auf digitalen optischen Speichern eingesetzt werden. d) Multilinguale Thesauri fördern die Standardisierung bei der Klassifikation von Dokumenten, erlauben einen eindeutigen und strukturierten Zugriff sowie unterstützen die Recherche nach Dokumenten, die nicht in der Sprache des Benutzers verfügbar sind. e) Multilinguale Volltextretrieval- und -übersetzungssysteme befinden sich im Probeeinsatz. Zusammen mit anderen Techniken wie Thesauri werden sie in Zukunft einfach zu benutzende Informationssysteme ermöglichen. f) Multilinguale Software ist eine Marktchance für europäische Software- und Systemhäuser. g) Multilinguale Retrieval- und Informationssysteme können in fast allen Wirt- schafts- und Verwaltungsbereichen, die grenz- und kulturübergreifend arbeiten, sinnvoll eingesetzt werden. ONLINE ´93 Kongress IV © Copyright PROJECT CONSULT GmbH 1992-1993 Seite 37 von 37