Wenn Maschinen lernen

Tuesday, 31. July 2012 um 11:23 Uhr

„Big data“: Mensch oder Maschine – wer behält den Überblick? Wie können Daten gesammelt, geordnet und weiterverarbeitet werden? 200 Datenexperten aus dem In- und Ausland diskutieren über neue Methoden und ihre Anwendung auf der Internationalen Jahreskonferenz der Deutschen Gesellschaft für Klassifikation (GfKl) vom 1. bis 3. August in Hildesheim. An der Universität Hildesheim forschen Wissenschaftler über das „Maschinelle Lernen“, IT-Interessierte studieren in Hildesheim Wirtschaftsinformatik.

„Datenvolumen wachsen – da sind so viele Informationen versteckt, die man alleine gar nicht finden kann“, erklärt Informatikerin Ruth Janning ihre Begeisterung für den Forschungsbereich „Maschinelles Lernen“ der Universität Hildesheim. „Also kommen die Maschinen ins Spiel, erkennen Muster, werten Datenmengen aus, klassifizieren sie.“ So können zum Beispiel Instrumente aus Musikstücken erkannt werden oder die Kreditwürdigkeit von Bankkunden erklärungsfähig bewertet werden.

Welche Probleme und Herausforderungen entstehen beim Ordnen, Klassifizieren und Analysieren von Daten? Wie kann man diese bewältigen, welche Methoden werden in der Praxis angewendet? Diesen Fragen geht Prof. Dr. Dr. Lars Schmidt-Thieme nach. Er leitet an der Universität Hildesheim den Bereich Wirtschaftsinformatik und Maschinelles Lernen. Große Datenmengen, wie Unternehmen, Finanzmarkt oder Verwaltung sie sammeln und aufbereiten, gehören zu seinem Forschungsalltag und zur Lehre im Studiengang Wirtschaftsinformatik. „Wir behalten den Überblick im Chaos. Für uns gibt es kein ‚Zuviel‘ an Daten.“

200 Datenexperten aus dem In- und Ausland werden zur 36. Internationalen Jahreskonferenz der Deutschen Gesellschaft für Klassifikation (GfKl) an der Stiftung Universität Hildesheim erwartet. Vom 1. bis 3. August beschäftigen sich die Wissenschaftler mit Methoden der Daten-Analyse und Statistik, des Maschinellen Lernens und der Wissensentdeckung („Knowledge-Discovery") sowie deren Anwendung.

„Datenanalyse ist derzeit unter dem Stichwort ‚big data‘ in nahezu allen Unternehmensbereichen von großer Bedeutung“, unterstreicht Prof. Schmidt-Thieme. In der Logistik, um Touren zu optimieren; im Online-Marketing, um herauszufinden, welche Produkte Kunden wirklich interessieren; in sozialen Netzwerken und Informationssystemen, um Inhalte und Abläufe an Nutzer-Bedürfnisse anzupassen. In der Medizin und den Biowissenschaften können mithilfe von Datenauswertungen personalisierte Therapien vorgeschlagen, im Verkehrswesen, Fahrzeuge intelligent geroutet und Fahrern zielgerecht Informationen bereitgestellt werden.

Aktuell arbeiten die Wissenschaftler der Universität Hildesheim in mehreren EU-geförderten Projekten, die Anwendung im Alltag finden. In großen Datenmengen suchen sie Regelmäßigkeiten und Muster, um für die Zukunft Empfehlungen oder Voraussagen zu treffen. Zwei Beispiele:

Ziel des Forschungsprojekts „Remix“ ist es, Museumsbesuchern einen „personalisierten Museumsbesuch" zu ermöglichen: Derzeit entwickeln die Wissenschaftler ein System, das Besuchern des Roemer- und Pelizaeus-Museums (RPM) in Hildesheim durch Datenanalyse und -aufbereitung Exponate „empfiehlt“. Es basiert auf RFID-Technologie (Radio Frequency Identification). Alle Exponate sind mit Sendern, die Besucher mit Smartphones und Empfängern ausgestattet.

Umweltfreundliche Verkehrsführung durch Datenanalyse: Wie können Fahrzeuge intelligent geroutet und Fahrer zielgerecht Informationen bereitgestellt werden? Im EU-geförderten Projekt „Reduction“, das von der Universität Hildesheim koordiniert wird, entwickeln Wissenschaftler aus fünf Ländern (Deutschland, Griechenland, Dänemark, Zypern, Niederlande) durch Aufbereitung von Daten ein intelligentes Transportsystem für das Management von Verkehr.

„Datenanalyse und Maschinelles Lernen ist wie die meisten Technologien anwendungsneutral: Man kann Prozesse für Menschen verbessern oder sie mit Werbung überhäufen. Bei der Anwendung dieser Technologien, insb. auf personenbezogene Daten, bedarf es deshalb klarer gesellschaftlicher, z.B. gesetzlicher Regelungen.“, unterstreicht Prof. Schmidt-Thieme.

Datenexperten auf Internationaler Konferenz vom 1. bis 3. August

Die GfKl ist die größte deutsche interdisziplinär ausgerichtete Konferenz im Bereich der Datenanalyse. Wissenschaftler aus Statistik und Mathematik, Informatik, Wirtschaftswissenschaften, insbesondere Marketing und Finanzwirtschaft, den Biowissenschaften sowie Sozial- und Geisteswissenschaften diskutieren auf der Konferenz über methodische Herausforderungen. Dabei betrachten die Datenexperten Problemstellungen aus der Daten-Analyse im Marketing, Finanzwesen, in der Bioinformatik und interdisziplinären Bereichen. Die Referenten und Gäste kommen u.a. aus Japan, Italien, USA, Frankreich, Deutschland, Canada.

Eröffnet wird die Konferenz am Mittwoch, 1. August um 9:00 Uhr auf dem Kulturcampus Domäne Marienburg der Universität Hildesheim (Burg-Theater).

Die Universität Hildesheim richtet die Konferenz zusammen mit der Otto-von-Guericke-Universität Magdeburg aus. Ein wichtiges Ziel ist es, junge Nachwuchs-wissenschaftler zu international konkurrenzfähigen Forschungsleistungen zu motivieren.

Maschinelles Lernen: Aktuelle Forschungsprojekte der Universität Hildesheim

Wirtschaftsinformatik in Hildesheim studieren / noch bis zum 22. Oktober einschreiben (Bachelor)


Wie können Daten geordnet und sinnvoll kombiniert werden? 200 Datenexperten aus dem In- und Ausland diskutieren an der Universität Hildesheim auf der größten interdisziplinären Konferenz für Datenanalyse. Foto: Fabian Brandes

Wie können Daten geordnet und sinnvoll kombiniert werden? 200 Datenexperten aus dem In- und Ausland diskutieren an der Universität Hildesheim auf der größten interdisziplinären Konferenz für Datenanalyse. Foto: Fabian Brandes Wie können Daten geordnet und sinnvoll kombiniert werden? 200 Datenexperten aus dem In- und Ausland diskutieren an der Universität Hildesheim auf der größten interdisziplinären Konferenz für Datenanalyse. Foto: Fabian Brandes