Universität Hildesheim > Institut für Angewandte Sprachwissenschaft > Robert Strötgen > Lehre > Übung "Werkzeuge zur statistischen Text- und Korpusanalyse"


Übung "Werkzeuge zur statistischen Text- und Korpusanalyse"
3110 (Wintersemester 2004/05)
Blockveranstaltung 21.-25. Februar 2005, 9:00-16:00 Uhr (2 SWS)
Raum F 207
Teilnehmerkreis: IIM-Studierende

Statistische Verfahren zur Text- und Korpusanalyse bieten eine Vielzahl von Möglichkeiten im Information Retrieval wie z.B. automatisches Klassifizieren, Erkennen von Wortklassen oder Erzeugung semantischer Relationen zwischen Ontologien. Werkzeuge wie Klassifizierer oder Part-of-Speech-Tagger werden mit Trainings-Dokumenten trainiert und können anschließend auf andere Dokumente angewendet werden. Neben einer kurzen inhaltlichen Einführung sollen in der Übung vor allem praktische Anwendungen von Werkzeugen erprobt werden. Kenntnisse in Java sind dabei Voraussetzung.

Anmeldung per E-Mail an stroetgen@uni-hildesheim.de erforderlich.


Links/Materialien/Werkzeuge


Literatur

  • Ferber, Reginald (2003): Information Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web. Heidelberg: dpunkt-Verlag. [UB: CSC 633 : F20]
  • Hausser, Roland (2000): Grundlagen der Computerlinguistik. Mensch-Maschine-Kommunikation in natürlicher Sprache. Berlin [u.a.]: Springer. [UB: LIN 430 : H19]
  • Witten, Ian H.; Frank, Eibe (2001): Data Mining. Praktische Werkzeuge und Techniken für das maschinelle Lernen. München [u.a.]: Hanser. [UB: CSC 611 : W36G]

Valid XHTML 1.0!