HPI-Tagung über Big Data: Unbekannte Muster
Warum der Algorithmus mehr sieht als der Mensch: Am Hasso-Plattner-Institut treffen sich in dieser Woche 150 Experten und Forscher, um über die zukünftige Nutzung von Big Data zu beraten.
Stand:
Potsdam - Bereits heute profitierten viele Firmen vom sogenannten Maschinellen Lernen. Diese „Intelligenten Firmen“ nutzen die künstliche Generierung von Wissen durch Rechnersoftware beispielsweise zur optimalen Platzierung ihrer neuen Produkte auf dem Markt. Intelligente Algorithmen, die in großen, komplexen Datenmengen Muster erkennen können, erledigen diese Arbeit. „Dazu werden Rechner benötigt, da die Datenmengen heute zu groß und komplex sind, als dass der Mensch darin überhaupt noch Muster erkennen könnte“, erklärt Professor Emmanuel Müller, der das Fachgebiet Knowledge Discovery and Data Mining am Hasso-Plattner-Institut (HPI) leitet.
150 Experten und Wissenschaftler am Hasso-Plattner-Institut
HPI-Forscher Müller hat mit Kollegen die Fachtagung „Learning, Knowledge, Data, Adaptation“ 2016 mit Schwerpunktthema „Big Data and Beyond“ organisiert, zu der sich bis Donnerstag noch über 150 Experten und Wissenschaftler am Potsdamer Institut treffen. Neueste Forschung im Bereich Big Data wird dort aus unterschiedlichsten Perspektiven vorgestellt. Ein Ziel ist es, Synergieeffekte zwischen den einzelnen Informatik-Fachrichtungen herzustellen.
Es gehe beispielsweise darum, neue Algorithmen des Maschinenlernens mit innovativen Speichertechniken (etwa In-Memory) zusammenzubringen. „So lassen sich in Zukunft der Datenzugriff beschleunigen und neue Analysemethoden entwickeln“, erklärt Müller im PNN-Gespräch. Ein Anwendungsbeispiel dafür ist die Geoforschung am Deutschen Geoforschungszentrum (GFZ), bei der über Messsensoren viele Daten gleichzeitig erfasst werden. Bislang wurde diese Datenflut allein mit geowissenschaftlichen Methoden analysiert. Nun können die Daten auch mit Methoden des Maschinellen Lernens untersucht werden. Ganze Datenarchive der vergangenen Jahrzehnte lassen sich so von Algorithmen durchforsten. „Das Ziel ist, darin unbekannte und unerwartete Muster zu entdecken“, erklärt Müller. So lasse sich beispielsweise ein Zusammenhang der Daten aus seismischen Messungen mit denen der Regensensoren erkennen. „Das sind sehr spannende Ergebnisse, bislang hatte niemand hier einen Zusammenhang vermutet“, so Müller. Nun sei aber deutlich geworden, dass Niederschläge mit Erdbewegungen und Seismik sehr wohl zusammenhängen können.
Rechner können aber dem Menschen das Nachdenken nicht abnehmen
Ganz können Computer dem Menschen das Nachdenken aber nicht abnehmen. „Ich würde immer nur von der Generierung von Hypothesen sprechen“, sagt Müller. Der Rechner kommt zu einem Ergebnis, das eben auch falsch sein kann. Am Ende brauche es nach wie vor den Menschen, der dieses Ergebnis aus der Expertensicht verifizieren kann. „Daran hapert es aber noch, oft versteht der Mensch das Ergebnis der Rechner gar nicht, weil es für ihn zu kompliziert ist“, erklärt der Experte für Data Mining. Daher arbeitet Müller mit seinem HPI-Team aktuell daran, wie man solche „maschinellen Ergebnisse“ anschaulicher gestalten kann.
Bislang entscheidet der Mensch, wie eine Erkenntnis zu bewerten ist. „Wir entwickeln nun Algorithmen, die den Menschen unterstützen, eine Entscheidung zu fällen“, erläutert Müller. Die neuen Algorithmen sollen die Daten in Zukunft aufbereiten. „Es geht aber nicht darum, den Menschen zu ersetzen, sondern dem Menschen die generierten Muster anhand der Daten zu erklären“, schränkt der Forscher ein.
Forscher wollen auch herausfinden, warum bestimmte Dinge zusammen gekauft werden
Mit seinen Kollegen modelliert Müller auch sogenannte homophile Graphstrukturen. Aus ihnen lassen sich etwa Erkenntnisse über das Kaufverhalten von Kunden erzielen. Informationen darüber, welche Dinge häufig zusammen gekauft werden, erhält man heute bereits bei Online-Händlern. Die Forscher wollen nun herausfinden, wovon es abhängt, dass bestimmte Dinge zusammen gekauft wurden – ob etwa der Preis oder die Kundenbeschreibungen Kaufauslöser waren. Die HPI-Forscher konzentrieren sich dabei auf die Grundlagenforschung im Bereich des Maschinenlernens. Die Fragen zur Sicherheit persönlicher Daten, die sich auf diesem Gebiet ergeben, werden am HPI in einem eigenen Fachgebiet erforscht, das HPI-Direktor Christoph Meinel persönlich verantwortet.
- showPaywall:
- false
- isSubscriber:
- false
- isPaid: