
Prof. Dr. Emmanuel Müller: Data Mining and Interactive Exploration of Heterogeneous Data
Mit Data Mining sollen Muster aufgedeckt werden, aus denen der Mensch später Entscheidungen ableiten kann.
Data Mining Algorithmen sind ein neues und wichtiges Hilfsmittel in vielen wissenschaftlichen und wirtschaftlichen Big Data Systemen. Data Mining endet dabei nicht mit der Ausführung von Algorithmen. Vielmehr möchte man mit Hilfe von Analysetechniken neue, unbekannte und unerwartete Muster aufdecken aus denen der Mensch entsprechende Entscheidungen ableiten kann. Auf der einen Seite erforschen wir effiziente Algorithmen, welche sowohl mit der Größe als auch mit der Komplexität von Datenbeständen skalieren. Auf der anderen Seite generieren unsere Algorithmen aus Sicht der Anwender leicht zu verifizierendes Wissen.
Wir entwickeln hierzu neue Data Mining Algorithmen zur Analyse von großen und komplexen Datenbeständen und unterstützen den Menschen mit neuen Methoden bei der interaktiven Datenexploration. Dies beinhaltet unter anderem Methoden zur Selektion von relevanten Attributen in hochdimensionalen Datenbanken, zur Korrelationsanalyse in multivariaten Datenströmen und zur anschaulichen Beschreibung von Anomalien in komplexen Daten. Weitere Forschungsgebiete sind die Analyse von multi-skalen Sensordaten und die interaktive Exploration von heterogenen Informationssystemen, welche in interdisziplinären Kooperationen mit Partnern aus Industrie und Wissenschaft erforscht werden.
Zur Person
Hasso-Plattner-Institut und Deutsches GeoForschungsZentrum, Knowledge Discovery and Data Mining Group
Emmanuel Müller ist zugleich Professor am Hasso Plattner Institut an der Universität Potsdam sowie am Deutschen GeoForschungsZentrum. Zuvor war er Nachwuchsgruppenleiter am Karlsruher Institut für Technologie und seit 2012 auch Postdoctoral Fellow an der University of Antwerp. Der studierte Informatiker, promovierte 2010 an der RWTH Aachen.
Links
Schlagworte
Big Data Analytics
Knowledge Discovery
Data Mining
Interactive Data Exploration
Heterogeneous Databases