Die Qualität von Visualisierungen: Eine Methode zum Vergleich zweidimensionaler Karten
Maximilian Eibl
eibl@berlin.iz-soz.de
Informationszentrum Sozialwissenschaft ñ GESIS ñ Berlin
Thomas Mandl
mandl@rz.uni-hildesheim.de
Informationswissenschaft ñ FB Sprachen und Technik ñ Universität Hildesheim
Abstract: Zweidimensionale Karten dienen im Information Retrieval häufig der Visualisierung von Dokumentbeständen. Über die Qualität der verschiedenen Methoden zur Erzeugung dieser Karten ist wenig bekannt. In diesem Artikel werden zwei Verfahren hinsichtlich ihrer Unterschiede verglichen. Dabei ist die Sichtweise des Benutzers beim Browsing in einer Karte der Ausgangspunkt. Das Experiment zeigt, dass die Methoden sowohl bei großen als auch bei kleinen Dokumentenmengen zu völlig unterschiedlichen Karten führen und zwischen den Karten keine Korrelation besteht. Daher muss die Methode zur Abbildung einer Dokumentenmenge auf eine zweidimensionale Karte für jede Anwendung erneut evaluiert und optimiert werden.
Visualisierung dient der Reduktion der Komplexität und ermöglicht Benutzern das schnelle Erkennen komplexer Zusammenhänge in Wissensstrukturen. Im Information Retrieval Prozess unterstützt die Visualisierung mehrere Stufen und kann etwa der Darstellung von Termen, logischen Beziehungen zwischen Anfrage-Operatoren oder Dokumenten dienen. Für letzteres werden oft zwei- oder dreidimensionale Räume entworfen, in denen etwa die Gravitätsmetapher wirkt. Zweidimensionale Karten drücken semantische Nähe von Dokumenten durch geringe räumliche Distanz aus. Am häufigsten wird die Kohonen Self-Organizing Map (SOM, cf. Kohonen 1998) benutzt, aber auch Latent Semantic Indexing (LSI, cf. Berry & Letsche 1995) oder Faktorenanalyse können zur Reduktion von Repräsentationen auf zwei Faktoren dienen.
Obwohl die Theorien der Wahrnehmung Vorteile versprechen, bleibt unklar inwieweit Visualisierungen den Information Retrieval Prozess unterstützen. Evaluierungen von Visualisierungen sind selten, das gilt auch für zweidimensionale Karten.
In den letzten Jahren haben zwei Implementierungen zweidimensionaler Karten im Internet große Mengen von Dokumenten analysiert und dargestellt. Chen et al. 1996 haben mit einer Kohonen-SOM die Dokumente aus der Yahoo-Kategorie Entertainment klassifiziert und dargestellt. Die große Anzahl von Dokumenten zwang zu einer schichtweisen Realisierung, bei der die Karte gewissermaßen in kleine Teilbereiche zerlegt wird, die auf einer übergeordneten Karte durch eine Fläche vertreten sind. Die Interaktion mit einer Karte erfolgt somit in mehreren Schritten, die dem Zoomen ähneln.
Eine noch umfangreichere Datenbasis liegt dem System WEBSOM (Kohonen 1998) zugrunde. Darin werden etwa eine Million Beiträge zu Diskussionsforen (Internet Newsgroups) organisiert. Ziel ist es, neben der hierarchischen Struktur der Diskussionsforen einen assoziativen Zugang über mehrere Newsgroups hinweg zu ermöglichen. Kohonen 1999 wählte als Strategie für die Bewältigung der großen Datenmenge wie Chen et al. 1996 einen schichtweisen Aufbau.
Die beiden Systeme zeigen auch Schwächen des Ansatzes. Lediglich Chen et al. 1996 berichtet von informellen Benutzertests, so dass keine Aussagen über die Vorteile der SOM oder zweidimensionaler Karten allgemein bei der Lösung von Informationsproblemen möglich sind. Die Autoren begründen auch die Wahl ihrer Methode nicht und können für den jeweiligen Anwendungsfall die Überlegenheit der SOM gegenüber anderen Methoden nicht nachweisen. In diesem Beitrag soll gezeigt werden, dass dies unbedingt erforderlich ist, da die zwei Methoden zu völlig unterschiedlichen Karten führen können.
Für die Evaluierung von zweidimensionalen Karten gibt es keine Standard-Verfahren wie für die Bewertung von Information Retrieval Systemen. Diese statistischen Methoden, die z.B. im Rahmen der Text Retrieval Conference (TREC) eingesetzt werden, basieren auf Ranking-Listen und lassen sich so nicht auf Ansätze auf der Grundlage von Browsing-Techniken anwenden. Dieser Beitrag stellt eine Methode zum Vergleich zweier Karten vor, die den Benutzerstandpunkt beim Browsing in den Mittelpunkt stellt, aber ohne aufwendige Benutzertests auskommt.
Eine Karte von Dokumenten hilft dem Benutzer dann, wenn semantisch ähnliche Dokumente nahe zusammen gruppiert sind. Nach der Fokussierung eines Dokuments wird der Benutzer die am nächsten gelegenen betrachten. Die Evaluierungsmethode nimmt daher ein Dokument als Ausgangspunkt und bestimmt die Euklidische Distanz zu allen anderen. Durch Berücksichtigung aller Dokumente entsteht so eine Ähnlichkeitsmatrix. Das Verfahren wird für jede Visualisierungsmethode wiederholt und es ergeben sich so mehrere Matrizen. Die Korrelation zwischen diesen Matrizen dient als Maß für den Vergleich der Methoden. Für die Berechnung der Korrelation wird die Matrix in ihre Spalten aufgeteilt und jede Spalte wird nach Ähnlichkeit sortiert. Der Spaerman-Rangfolgen-Koeffizient bestimmt die Korrelation zwischen den Ranking-Listen der verschiedenen Methoden. Der Durchschnitt der einzelnen Listen bildet das Resultat für die Matrizen.
Spearman:
(Hartung 1984)
Die Daten für das Experiment stammen aus den Datenbanken des Informationszentrums Sozialwissenschaften (IZ) in Bonn. Indexierer des IZ verschlagworten intellektuell sozialwissenschaftliche Fachliteratur und Projektinformationen. Eine Untermenge bildet das deutschsprachige Fachkorpus für das Cross Language Evaluation Forum (CLEF), das Systeme für multilinguales Information Retrieval bewertet.
Mit einem Ausschnitt von 1000 Dokumenten wurden mit LSI und SOM zwei zweidimensionale Dokumentenkarten gebildet. Der Vergleich nach der oben geschilderten Methode führte zu einer Korrelation von 0,053. Dies zeigt, dass zwischen den Matrizen keine Ähnlichkeit besteht. Das Experiment wurde auch für kleinere Mengen von zehn und hundert Dokumenten durchgeführt. Auch in diesen Fällen ergab sich keine Korrelation wie die folgende Tabelle zeigt.
Tabelle 1: Ergebnisse
Anzahl der Dokumente |
1000 | 100 (Durchschnitt aus zehn Mengen) | 10 (Durchschnitt aus 100 Mengen) | Höchste Korrelation für eine Menge von 10 Dokumenten |
Korrelation |
0,053 | 0,037 | 0,013 | 0,34 |
In der Literatur wird oftmals als gesetzt angesehen, daß Visualisierungen textuellen Formen der Datenpräsentation überlegen sind. Die kognitionswissenschaftlich durchaus begründbare Vermutung führt bei der Gestaltung von Visualisierungen oftmals scheinbar zu einer nicht weiter hinterfragten Annahme, daß die geschaffene Visualisierung von Vorteil sei. Auf die Durchführung von Evaluationen wird meist verzichtet. In diesem Artikel wird gezeigt, wie wichtig jedoch solche Evaluationen sind, kann doch schon die Verwendung unterschiedlicher Konstruktionsprinzipien ein und desselben Visualisierungstyps zu erheblich unterschiedlichen Ergebnissen führen. Solange die Ergebnisse verschiedener Techniken zu solch divergenten Ergebnissen führen, sind zusätzliche Anwendertests notwendig, um die geeignetere Technik zu bestimmen.
Literatur
Berry, Michael; Dumais, Susan; Letsche, Todd (1995): Computational Methods for Intelligent Information Access. In: Proc. ACM Supercomputing ë95. San Diego, CA. S. 1-38.
Chen, Hsinchun; Schuffels, Chris; Orwig, Richard (1996): Internet Categorization and Search: A Self-Organizing Approach. In: Journal of Visual Communication and Image Representation. 7(1). S. 88-101.
Hartung, Joachim (1984): Lehr- und Handbuch der angewandten Statistik. München, Wien.
Kohonen, Teuvo (1998): Self-organization of Very Large Document Collections: State of the art. In Niklasson, L.; Bodén, M.; Ziemke, T. (eds.): Proceedings of ICANN ´98, 8th International Conference on Artificial Neural Networks, Springer: London. vol. 1, S. 65-74.