|
Universität Hildesheim > Institut für Angewandte Sprachwissenschaft > Robert Strötgen > Lehre > Seminar "Meta-Daten und ihre Extraktion aus dem Web" |
|
|
|
|
|
Seminar "Meta-Daten und ihre Extraktion aus dem Web" Bei einer Stichprobe sozialwissenschaftlicher Internet-Dokumente hatten 60% kein Abstract und 87% keine Schlagworte, 11% noch nicht einmal einen Titel. Nur ein minimaler Bruchteil war nach Metadaten-Standards wie vor allem Dublin Core erschlossen. Das Projekt CARMEN (Content Analysis, Retrieval and MetaData: Effective Networking) beschäftigt sich unter anderem mit semantischer Heterogenität und insbesondere mit der Extraktion fehlender Meta-Daten. Diese Lehrveranstaltung bietet zunächst eine Einführung in Metadaten, stellt das Projekt CARMEN vor und führt dann nach jeweils kurzen Einführungen in zugrundeliegende Techniken (z.B. XML) in die praktische Extraktion von Metadaten aus Internet-Dokumenten ein. Voraussetzungen: Kenntnisse von HTML und Java erwünscht |
|
|
|
|
|
© 2003-2007 Robert Strötgen |
|