Information Retrieval

Freitag, 26. März 2004 um 17:13 Uhr

Forschungsschwerpunkt der Informationswissenschaft

Die stark anwachsende Menge von Wissen im Internet erfordert von den Suchmaschinen neue Technologien für die Suche nach relevanten Informationen. Die Informationswissenschaft an der Universität Hildes­heim befasst sich intensiv mit den Aspekten Qualität sowie Mehr­sprachigkeit.

Qualität

Die niedrige Qualität von Inter­net-Angeboten und deren großer Umfang, den Menschen nicht mehr bewältigen können, erfordert eine teilweise übertragung der Qualitätsbewertung auf Maschinen. Dr. Thomas Mandl analysiert im seinem DFG-Projekt AQUAINT (Automatische Qualitätsabschätzung für Internet Ressourcen) bereits bestehende Ansätze zur Automatisierung der Qualitätsbewertung. Diese erfordern jedoch eine stärkere wissenschaftliche Fundierung. Sie nutzen einzelne und begrenzte Aspekte von Qualität (vor allem Linkanalyse). In AQUAINT werden neue und komplexere Verfahren zur automatische Qualitätsbewertung entwickelt und in einem prototypischen Service implementiert. Eine wichtige Anwendung liegt in Suchmaschinen der nächsten Generation.

Mehrsprachigkeit

Die Mehrsprachigkeit im Internet erfordert die Integration von Technologien für die Suche über mehrere Sprachen. Durch die Einbettung der Informationswissenschaft im Studiengang Internationales Informationsmanagement (IIM) stellt die Universität Hildesheim ein hervorragendes Umfeld für die Forschung in diesem Bereich dar, so dass auch Studierende in die Arbeiten integriert werden. Das von der EU geförderte Cross-Language Evaluation Forum (CLEF) etabliert seit 2000 eine Evaluationsumgebung für mehrsprachiges Information Retrieval, das inzwischen acht europäische Sprachen umfasst. Die Universität Hildesheim beteiligt sich unter der Leitung von Frau Prof. Dr. Womser-Hacker im Rahmen eines europäischen Konsortiums seit vier Jahren an der Organisation von CLEF und übernimmt dort vor allem Aufgaben, für die sprach- und in­for­mationswissenschaftliche Kompetenzen notwendig sind. CLEF findet weltweit große Resonanz und zieht jedes Jahr mehr Forschergruppen an.

Systementwicklung

Darüber hinaus nahm die Informationswissenschaft unter Leitung von Prof. Dr. Womser-Hacker und Dr. Mandl selbst bereits zweimal an den Retrievaltests teil. Zuletzt bearbeitete das in Hildesheim entwickelte System ein vier­sprachiges Korpus und schnitt bei der Eva­luierung gut ab. Für 2004 ist eine weitere Teilnahme in Kooperation mit dem Fachinformationszentrum Karlsruhe zur Bearbeitung von Russisch und Finnisch vorgesehen. Die Einschränkung von CLEF auf europäische Sprachen wurden in anderen Projekten bereits durch­brochen. So arbeiten Mitarbeiter und Studierende bereits an Retrieval-Ansätzen für Arabisch und Chinesisch.

Veranstaltungen

Ergebnisse von CLEF wurden bereits zweimal im Hildesheimer Information Retrieval und Evaluierungs-Workshop (HIER) diskutiert. Dieses Jahr organisieren Prof. Dr. Womser-Hacker, Dr. Schneider und Dr. Mandl zusammen mit Kollegen der Daimler-Chrysler-Forschung in Ulm einen Workshop einen Workshop auf internationaler Ebene, der Forschungsarbeiten zur weitergehenden Analyse von Information Retrieval Ergebnissen stimulieren soll. In der Herbstschule Information Retrieval der Gesellschaft für Informatik gaben u.a. Hildesheimer Dozenten ihr Wissen an Industrieangehörige, Wissenschaftler benachbarter Disziplinen und Studierende weiter.

Die Forschung zum Information Retrieval kommt auch den Kooperationspartnern zugute. So gehen Erfahrungen in die Kooperation mit der Universitätsbibliothek Hildesheim im Rahmen des Projektes Virtuelles Bibliotheksregal Informationswissenschaft (MyShelf) ein und auch die Blaupunkt GmbH schätzt das Know-How bei multilingualen Systemen im Rahmen des Drittmittelprojektes EIKON (Einbaukonfigurationssystems für Car Multimedia Zubehör).