Ralph Kölle , Thomas Mandl

Data Mining

Vorlesung/Seminar mit Übung Sommersemester 2001

Übungen: Raum: F 207 Zeit: Di 8.30 und 10.00 Uhr
Vorlesung/Seminar: Raum: H3 Zeit: Mi 14.30 Uhr

e-mail für Abgabe der Hausaufgabe: DataMiningSS2001@aol.com

Inhalt:

Termin Vorlesung / Seminar Übung

Einführung Data Mining

regelbasierte Methoden (Entscheidungsbäume) 1.5.

Einführung Weka Paket Datenformat, erster Aufruf Weka

Clustering Clustering

Klassifikation: lineare Verfahren Klassifikation

Evaluierung Evaluierung

Klassfikation: Neuronale Netze Neuronale Netze

Klassfikation: Entscheidungsbäume Entscheidungsbäume

Datenvorbereitung Filter

Klassfikation: SVM und Metalernverfahren als Zip Klassfikationswettbewerb

JAVA Netzwerkprogrammierung JAVA Netzwerkprogrammierung

Genetische Algorithmen und Visualisierung :-)

Literaturverzeichnis

Teilnehmerkreis:
IIM Studierende ab 3. Semester (Schein: G6)
Der Kurs ist insbesondere für Studierende im Hauptstudium geeignet, die in diesem Bereich eine Magisterarbeit bearbeiten wollen.
IM/IT Studierende

Voraussetzungen:
informationswissenschaftliche Grundkenntnisse und JAVA Kenntnisse

Inhalt:
Ansätze des Data Mining versuchen, bisher unbekanntes Wissen in großen Datenbeständen zu entdecken. Dazu werden Muster und Zusammenhänge analysiert, die über einfache Abfragen hinausgehen. Typische Methoden des Data Mining sind Clustering, Suche nach Assoziationen, Klassifikation und Visualisierung. Der Kurs orientiert sich weitgehend an folgendem Buch und benutzt das darin beschriebene, frei zugängliche Software-Paket Weka:

Witten, Ian; Frank, Eibe (2000): Data Mining: Practical Machine Learning Tools and Techniques with JAVA Implementations. Morgan Kaufman: San Francisco et al.
http://www.cs.waikato.ac.nz/ml/weka

Für einige Techniken wie Visualisierung und neuronale Netze wird auf weitere Pakete zugegriffen. Ziel des Kurses ist es, grundlegende Techniken des Data Mining kennenzulernen, diese zu üben und in einem selbst gewählten Beispiel anzuwenden. Der Stoff wird in der Vorlesung/Seminar vermittelt. Mit der Software Weka sollen in der Übung die Algorithmen an einfachen Beispielen getestet werden. Die regelmäßige Bearbeitung der einfachen Übungsaufgaben bildet die Voraussetzung für den Scheinerwerb, der durch die Realisierung einer kleinen Data Mining Anwendung erfolgen kann. An einem selbst gewählten und kleinen Beispiel sollen die entscheidenden Schritte des Data Mining durchgeführt werden.
Der Besuch der Vorlesung ohne Übung ist nicht sinnvoll (aber möglich).