Elektronisches Verbandsinformations-
und Analysesystem
ELVIRA ist ein Client-Server-System für die Recherche von statistischen Zeitreihen. Der Schwerpunkt bei der Entwicklung von ELVIRA lag auf der softwareergonomischen Gestaltung der Benutzungsoberfläche. Die Benutzer soll möglichst schnell kennen die für ihn relevanten Daten aus der großen Gesamtmenge recherchieren, ohne die interne Struktur aller Datenbestände zu.
ELVIRA bietet optimierte Zugänge für statistische Zeitreihen (Fakten) und Text-Dokumente. Um eine optimale Unterstützung des Rechercheprozesses zu erreichen, sollen Benutzer ihre Anfragen ohne Neuformulierung auf den jeweils andere Datentyp anwenden können. Dafür sind Transformationen zwischen den unterschiedlichen Repräsentationsmechanismen von Texten und Fakten nötig.
Inzwischen wird das ursprünglich für den ZVEI entwickelte System von drei Industrieverbänden für die Mitgliedsunternehmen angeboten ( Hauptverband der Deutschen Bauindustrie , Wiesbaden, HVB; Verband Deutscher Maschinen- und Anlagenbau , Frankfurt, VDMA; Zentralverband der Elektrotechnik- und Elektronikindustrie , Frankfurt, ZVEI). Momentan sind die verschiedenen Versionen von ELVIRA an über 300 Arbeitsplätzen installiert. ELVIRA wird ausführlich in Scheinost et al. 1998 beschrieben. Softwareergonomische Weiterentwicklungen finden sich in Mandl/Stempfhuber 1998 .
Heterogene Produktnomenklaturen
Ein großes Heterogenitätsproblem im Kontext von ELVIRA ist die Existenz verschiedenster Produktnomenklaturen, die jeweils eine spezielle Sicht auf die Elektroindustrie oder die gesamte Industrie darstellen. Dies trifft bereits für die reine Faktenrecherche zu und spielte beim Entwurf der Benutzungsoberfläche der Zeitreihensuche eine entscheidende Rolle. Eine einheitliche Einteilung der Industrie konnte nicht entwickelt werden. Jede bestehende Nomenklatur repräsentiert Benutzersichten und ist damit gerechtfertigt. Aufgrund der Vertrautheit der Benutzer mit den bestehenden Nomenklaturen, ist es auch sinnvoll diese zu integrieren und so Altwissen auszunutzen. So heißen z.B. Waschmaschinen im Güterverzeichnis für Produktionsstatistiken Waschvollautomaten (weitere Bsp. siehe Mandl 1998 ).
Heterogenität durch Text-Fakten-Integration
Die Text-Fakten-Integration ist ein Spezialfall der Heterogenitätsbehandlung im Information Retrieval, der in ELVIRA (Elektronisches Verbandsinformations-, Retrieval- und Analysesystem) entscheidend ist. Die Integration des Textretrievals und die Forderung nach Überstiegen zwischen Texten und Fakten verschärft die Situation. Textretrieval-Systeme wie das in ELVIRA benutzte Fulcrum generieren aus dem Volltext Wortlisten und nutzen diese für die Repräsentation der Texte. Daneben werden Texte auch oft intellektuell bestimmten Klassifikationen zugeordnet, im Falle von ELVIRA besonders Produktnomenklaturen.
Sowohl die automatisch erzeugten Wortlisten als auch die zusätzlichen Thesauri der Anbietern von Text-Datenbeständen sind gewissermaßen weitere Nomenklaturen. Eine weiteres Problem stellt die unterschiedliche Anfrage-Logik dar. Im Faktenzugang sind die Deskriptoren in die drei Facetten Themen, Branchen und Länder eingeteilt. Diese können nur auf spezifische Art zu Booleschen Anfragen kombiniert werden, was bei der Optimierung der Benutzungsoberfläche ausgenutzt wurde (cf. Scheinost et al. 1998 ). Zwischen den Facetten wird das Boolesche UND gesetzt und innerhalb der Facetten werden die Deskriptoren mit ODER verbunden. Beim Textretrieval sind solche Einschränkungen natürlich nicht vorgegeben. Eine Schwierigkeit bei dieser Umsetzung besteht darin, daß bei der Freitext-Indexierung gewonnenes Vokabular und häufig auch Thesauri diese Unterscheidung der Deskriptoren in drei Facetten gar nicht leisten.