Ausgeschriebene Qualifikationsarbeiten (BA, MA)

Betreuer: Gertrud Faaß, PhD und Prof. Ulrich Heid

  • Abschlussarbeit (Studiengang: MA IIM-IW), oder
  • Projekt (Studiengang Bsc IMIT, Projektarbeit (10 AP) in einem der Gebiete Informatik, Betriebswirtschaft oder Informationswissenschaft) oder
  • Projekt und Abschlussarbeit kombiniert (Studiengang: BA IIM).

Die informationswissenschaftliche Aufbereitung von Daten und deren benutzergerechte Präsentation stehen im Mittelpunkt der hier beschriebenen Arbeiten.

 

Ausschreibung 1

Ein Repositorium computerlinguistischer Ressourcen an der Universität Hildesheim soll interessierten Studierenden und MitarbeiterInnen der Universität einen Überblick über vorhandene Textsammlungen und deren Aufbereitungsgrad sowie über computerlinguistische Werkzeuge (Annotationstools wie Tagger oder Parser, etc.) bieten. Solche Repositorien gibt es bereits, z.B. bietet das CLARIN Forschungsnetzwerk (www.clarin.eu) die Möglichkeit, sich über computerlinguistische Ressourcen auf der ganzen Welt zu informieren. Wir planen eine „kleinere Ausgabe“ eines solchen Repositoriums, die ausschließlich lokal verfügbar sein und – ähnlich den Abfragewerkzeugen der Universitätsbibliothek für deren Ressourcen – Auskunft über nutzbare Ressourcen geben soll. In der studentischen Arbeit soll es zum einen um die Untersuchung von Möglichkeiten gehen, Methodik und Metadatenspeicherung des CLARIN Repositoriums auf einen lokalen Kontext zu übertragen, ein solches Repositorium wird von uns aufgesetzt und mit ersten Daten gefüllt werden (für die meisten Ressourcen stehen Daten im CLARIN-Format und Beispiele für Metadaten nach CMDI zur Verfügung. Eine Benutzerschnittstelle soll es dann den vorgesehenen NutzerInnen und Nutzern ermöglichen, geeignete Ressourcen mithilfe ihrer gespeicherten Metadaten zu finden. Desweiteren ist es nötig, eine „Maintainer“-Schnittstelle einzurichten, mit denen Ressourcen verwaltet werden können: zum einen über das automatische Einlesen von Daten im CLARIN-Format, zum anderen über ein Front-End (Browser, getestet für Linux und Windows).

 

Ausschreibung 2

(Bitte wenden Sie sich an Prof. Heid, eventuell wirkt Frau Dr. Laura Giacomini als Zweitgutachterin)

Uns liegen multilinguale technologische Terminologie-Daten (XML) aus einer nicht mehr verfügbaren Datenbank vor, die in eine neu zu entwickelnde dynamische Datenbank mit GUI eingearbeiten werden sollen. Diese Software soll Auskunft über terminologische Daten geben und damit Übersetzer unterstützen. Dabei sind internationale Standards und auch vergleichbare kommerzielle Systeme zu berücksichtigen.

Wir sehen diese Ausschreibung als geeignet für Studierende, die sich mit konkreten multilingualen Informationsprozessen auseinandersetzen möchten.

Weitere Arbeiten können auf den Homepages der MitarbeiterInnen gefunden werden.