Big data: Ereignisse früh erkennen

Friday, 28. February 2014 um 20:30 Uhr

Mit Daten aus sozialen Medien und physischen Sensordaten sollen Ereignisse, etwa Überschwemmungen und Verkehrsbehinderungen, früh erkannt werden. Informatiker der Uni Hildesheim arbeiten mittlerweile mit Petabyte – und können die gigantisch großen Datenmengen ordnen und analysieren. Das EU-Projekt Eppics ist nah dran an der Alltagswelt – und in diesem Monat gestartet.

Informatiker der Universität Hildesheim wollen Ereignisse besser verstehen, überwachen und vorhersagen. Dabei greifen sie auf Daten aus sozialen Medien wie Facebook und Twitter und auf physische Sensordaten zurück. Und arbeiten mit Fallbeispielen in England und Italien. „Wir entwickeln Methoden, um mit großen Datenmengen umzugehen und so Ereignisse beobachten und möglichst früh vorhersagen zu können. Wir haben es mittlerweile mit Petabyte zu tun – also gigantisch große Datenmengen“, sagt Prof. Dr. Lars Schmidt-Thieme. Diese Methoden werden in eine Plattform integriert, die Bürger, Behörden und Organisationen dabei unterstützt, rechtzeitig die richtigen Entscheidungen zu treffen.

Die Informatiker sind mit „Eppics“ – so die Abkürzung für das Projekt „Event prediction and decision support based on huge data from physical-social-cyber-systems“ – nah dran an der Alltagswelt.

In der englischen Stadt Bristol konzentrieren sich die Forscher auf das Management von großen Veranstaltungen wie etwa Festivals. Dabei geht es nicht um personenbezogene Daten, unterstreicht der Professor für Wirtschaftsinformatik. „Wir wollen nicht erfahren, ob Herr Müller jeden Montagmorgen die Kreuzung passiert, sondern ob ein Verkehrschaos naht“, beschreibt Schmidt-Thieme das Interesse an den Verkehrsdaten. So können etwa Staus vermieden werden, indem Fahrer eine andere Route einschlagen. Es geht um „intelligentes Management in Städten, vor allem bei Großereignissen aber auch Krisenmanagement“, ergänzt der Informatiker Lucas Drumond. Dazu gehören geplante Ereignisse, wie Konzerte und Festivals, aber auch ungeplante Ereignisse wie ein Verkehrsstau und Naturkatastrophen. Die in „Eppics“ entwickelten Technologien werden Entscheidungsträger dabei unterstützen, den Ablauf der Ereignisse zu beeinflussen, beispielsweise indem sie Verkehr umleiten oder Krankenwagen an den Ort eines Verkehrsunfalls schicken, sagt Drumond. Bisher werden solche Wege des intelligenten Verkehrsmanagements in Städten wie Monza, Venedig und Stuttgart angewandt. Diese Städte arbeiten mit Daten aus physikalischen Sensoren wie zum Beispiel Videokameras. Eppics kombiniert solche Daten mit jenen aus sogenannten „sozialen Sensoren“ - greift also relevante Informationen aus sozialen Medien auf, so Lukas Drumond.

In der Region Alto Adriatico in Italien greifen die Informatiker auf Datenmengen zurück um Überschwemmungen und deren Auswirkungen zu überwachen und möglichst frühzeitig vorhersagen zu können. „Wir kombinieren Umweltinformationen mit sozialen Internetdaten“, so Lars Schmidt-Thieme. Eine große Herausforderung ist dabei, meteorologische Sensoren und Daten aus sozialen Netzwerken so zu kombinieren, dass Krisenszenarien im entscheidenden Augenblick erkannt werden können – um die geeigneten Maßnahmen zu ergreifen.

„Wir werden Information aus hunderten von Sensoren, tausenden von Autos und aus sozialen Medien integrieren. Dabei arbeiten wir mit einer Datenmenge von insgesamt zwei Petabytes – das entspricht etwa 430 Millionen MP3 Dateien, drei Millionen CDs oder 446 Tausend DVDs“, erklärt Lucas Drumond, der in Brasilien studiert hat und derzeit seine Doktorarbeit in Hildesheim abschließt. Nun gehört er zu dem Projektteam. Denn „Eppics“ wird von Hildesheim aus koordiniert: Die Arbeitsgruppe für Wirtschaftsinformatik und Maschinelles Lernen an der Universität Hildesheim beschäftigt sich mit den Herausforderungen die beim Ordnen, Klassifizieren und Analysieren von Daten entstehen. Dabei entwickeln die Informatiker mathematische Modelle, die eine automatische Erkennung von Strukturen und Mustern in großen Datenmengen ermöglichen. „Die größte Herausforderung in dem Projekt ist die Verarbeitung derartiger Datenmengen, da sie nicht mehr auf einem einzelnen Rechner gespeichert werden können. Unsere Aufgabe ist, Methoden des Maschinellen Lernens zu entwickeln, die gleichzeitig auf verschiedenen Rechenmaschinen ausgeführt werden können und in einer kurzen Zeitspanne Resultate liefern“, erklärt Drumond.

Das Projekt ist 2014 gestartet und läuft bis Anfang 2017. Die EU fördert das Eppics-Projekt im „Seventh Framework Program“, zwölf Organisationen aus fünf Ländern (Deutschland, England, Frankreich, Italien und Polen) sind beteiligt.