Data Mining
Vorlesung/Seminar mit Übung Sommersemester 2001
Übungen: Raum: F 207
Zeit: Di 8.30 und 10.00 Uhr
Vorlesung/Seminar: Raum: H3 Zeit:
Mi 14.30 Uhr
e-mail für Abgabe der Hausaufgabe:
DataMiningSS2001@aol.com
Inhalt:
| Termin | Vorlesung / Seminar | Übung |
| Einführung Data Mining | ||
| regelbasierte Methoden (Entscheidungsbäume) | 1.5. | |
| Einführung Weka Paket | Datenformat, erster Aufruf Weka | |
| Clustering | Clustering | |
| Klassifikation: lineare Verfahren | Klassifikation | |
| Evaluierung | Evaluierung | |
| Klassfikation: Neuronale Netze | Neuronale Netze | |
| Klassfikation: Entscheidungsbäume | Entscheidungsbäume | |
| Datenvorbereitung | Filter | |
| Klassfikation: SVM und Metalernverfahren als Zip | Klassfikationswettbewerb | |
| JAVA Netzwerkprogrammierung | JAVA Netzwerkprogrammierung | |
| Genetische Algorithmen und Visualisierung | :-) |
Teilnehmerkreis:
IIM Studierende ab 3. Semester (Schein: G6)
Der Kurs ist insbesondere für Studierende
im Hauptstudium geeignet, die in diesem Bereich eine Magisterarbeit bearbeiten
wollen.
IM/IT Studierende
Voraussetzungen:
informationswissenschaftliche Grundkenntnisse
und JAVA Kenntnisse
Inhalt:
Ansätze des Data Mining versuchen, bisher
unbekanntes Wissen in großen Datenbeständen zu entdecken. Dazu
werden Muster und Zusammenhänge analysiert, die über einfache Abfragen
hinausgehen. Typische Methoden des Data Mining sind Clustering, Suche nach
Assoziationen, Klassifikation und Visualisierung. Der Kurs orientiert sich
weitgehend an folgendem Buch und benutzt das darin beschriebene, frei zugängliche
Software-Paket Weka:
Witten, Ian; Frank, Eibe (2000): Data Mining: Practical
Machine Learning Tools and Techniques with JAVA Implementations. Morgan
Kaufman: San Francisco et al.
http://www.cs.waikato.ac.nz/ml/weka
Für einige Techniken wie Visualisierung
und neuronale Netze wird auf weitere Pakete zugegriffen. Ziel des Kurses ist
es, grundlegende Techniken des Data Mining kennenzulernen, diese zu üben
und in einem selbst gewählten Beispiel anzuwenden. Der Stoff wird in
der Vorlesung/Seminar vermittelt. Mit der Software Weka sollen in der Übung
die Algorithmen an einfachen Beispielen getestet werden. Die regelmäßige
Bearbeitung der einfachen Übungsaufgaben bildet die Voraussetzung für
den Scheinerwerb, der durch die Realisierung einer kleinen Data Mining Anwendung
erfolgen kann. An einem selbst gewählten und kleinen Beispiel sollen
die entscheidenden Schritte des Data Mining durchgeführt werden.
Der Besuch der Vorlesung ohne Übung ist
nicht sinnvoll (aber möglich).