Exzellenzstrategie : Mit Mathematik zur richtigen Diagnose

Am Exzellenzcluster MATH+ werden durch eine qualitativ verbesserte Datenanalyse neue Verfahren für die medizinische Früherkennung entwickelt.

Christian J. Meier
Mehrwert für die Medizin: Schon heute werden massenhaft Gesundheitsdaten erfasst, etwa von elektronischen Fitnessbändern im Sport.
Mehrwert für die Medizin: Schon heute werden massenhaft Gesundheitsdaten erfasst, etwa von elektronischen Fitnessbändern im Sport.Foto: picture alliance / Uwe Umstätter

Wir betreiben Mathematik nicht um ihrer selbst willen“, sagt Christof Schütte von der Freien Universität Berlin. Der Praxisbezug ist für einen der drei Sprecher von „MATH+“ das Markenzeichen dieses Exzellenzclusters, den die Freie Universität im Rahmen des Exzellenzstrategie-Wettbewerbs gemeinsam mit der Technischen Universität Berlin und der Humboldt-Universität zu Berlin eingeworben hat – mit dem Weierstraß-Institut für Angewandte Analysis und Stochastik sowie dem Zuse-Institut Berlin als Partner-Einrichtungen.

Seien es am Computer maßgeschneiderte Medikamente, die Kontrolle moderner Energienetze oder die Logistik: Die anwendungsorientierte Mathematik verbinde die fünf Trägerinstitutionen, sagt Christof Schütte. Mit MATH+ soll unter anderem ein hochaktuelles Feld weiter erschlossen werden: Big Data und Künstliche Intelligenz.

Daten bilden den gesamten Alltag immer detailgenauer ab. Die Digitalisierung verdoppele die soziale Welt, sagt der Münchner Soziologe Armin Nassehi. Während die analoge Welt komplexer werde, erlaube die digitale Kopie, versteckte Muster zu finden, die sich in der Realität anwenden lassen. So könnte man auch das Ziel von MATH+ beschreiben: Die Komplexität großer Datenmengen zu analysieren, um Probleme des Alltags, der Gesellschaft oder Politik besser zu verstehen.

Ziel ist eine präventive Medizin

Ein Beispiel dafür ist die Arbeit von Tim Conrad. Der Bioinformatikprofessor von der Freien Universität entwickelt neue Verfahren, um komplexe medizinische Daten umfassend auswerten zu können. Dank verbesserter bildgebender Verfahren in der Diagnostik oder auch der Nutzung von elektronischen Fitnessbändern im Sport fielen diese zwar in rauen Mengen an. Doch bleibe nützliches Wissen oft hinter der Komplexität verborgen. „Wir wollen die Informationen erschließen, um zu einer präventiven Medizin zu kommen“, sagt Tim Conrad.

Aus einem Blutstropfen lasse sich im Prinzip Krebs frühzeitig erkennen, sagt der Forscher. Das Problem dabei: Die Körperflüssigkeit enthält das gesamte Spektrum der Biochemie: etwa Proteine oder andere Biomoleküle mit den „Bauanleitungen“ für diese Proteine und Milliarden weiterer genetischer „Buchstaben“ im Erbut. Krankheiten verändern diese Gemengelage auf oft undurchsichtige Weise. Conrad und sein Team wollen dieses Geschehen transparenter machen – mithilfe der Mathematik.

„Künstliche Intelligenz ist gut darin, Korrelationen in den Daten zu finden“, erklärt der Bioinformatiker. Von einer „Korrelation“ sprechen Statistiker, wenn zwei Variablen in den Daten einen Zusammenhang zeigen, etwa das Auftreten bestimmter Stoffe in der Blutprobe und die Entstehung einer Krankheit. Eine Korrelation beweist zwar keinen ursächlichen Zusammenhang, kann in der Praxis aber als Warnsignal dienen.

Neue digitale Techniken, sagt Conrad, brächten zudem eine zusätzliche Dimension in die Daten: Zeit. Pflaster auf dem Bauch messen den Insulinspiegel kontinuierlich, die Smart Watch „beobachtet“ die Schlafqualität die ganze Nacht lang, das Fitnessband „misst“ den Puls über Stunden. „Diese Daten zusammengenommen beschreiben wichtige Aspekte des Gesundheitsstatus‘ eines Menschen“, sagt der Forscher. Veränderungen könnten früh erkannt werden. Wenn ein Mensch Stress hat, sich weniger bewegt und ungesünder isst, könnte ihn ein intelligentes System darauf aufmerksam machen, erläutert Tim Conrad.

Milliarden von Parametern

Wie kann dabei die Mathematik helfen? Die genannten Anwendungen haben eines gemeinsam: Der Algorithmus erkennt Muster in einem Datensatz. So ähnlich arbeiten auch Ärzte, etwa wenn sie auf einem CT einen Schatten für verdächtig halten, weil sie ähnliche Schatten zuvor schon oft als Tumor identifiziert haben. Doch je größer die Datensätze werden und je mehr davon zusammengeführt werden, desto schwieriger wird es für Menschen, Muster darin zu erkennen.

Will man eine Menge von Bildern auswerten, haben diese zusammengenommen Milliarden von Pixeln. Eine Patientenakte umfasst viele Aspekte der Krankengeschichte eines Menschen mit Daten über ihn und die durchgeführten Untersuchungen. In Milliarden von Parametern spiegelt sich mehr medizinisch relevante Information als ein ganzes Ärzte-Team herauslesen könnte. Und sogar Maschinen geraten beim Verarbeiten der Komplexität an ihre Grenzen. Die Mathematik ihrerseits kennt Verfahren, um Kompliziertheit zu vereinfachen.

„Unsere Algorithmen stellen fest, welche der Millionen von Parametern für die Fragestellung wirklich wichtig sind“, erklärt Tim Conrad. Viele der Variablen seien nicht unabhängig voneinander. „Das ist so ähnlich wie in einem Landschaftsbild.“ Wenn ein Pixel blau ist, ist die Wahrscheinlichkeit groß, dass auch die benachbarten blau sind: Weil alle zum Himmel gehören. Analog dazu wie eine Pixelmenge in einem Bild ein Objekt ergibt, werden durch die Methodik der Berliner Forscher Parameter in Kategorien zusammengefasst.

Diese Rubriken wirken dann wie ein neuer reduzierter Satz an Parametern. Auf das Landschaftsbild übertragen, kann sich die Datenanalyse nun auf Himmel, Wiese und Reh beschränken, anstatt den Vergleich von Millionen von blauen, grünen und braunen Pixeln erforderlich zu machen.

So soll das massenhafte Erfassen von Daten zum Mehrwert für die Medizin werden. Doch ein Mehr an Daten führe nicht automatisch zu besseren Erkenntnissen, betont Tim Conrad. Manche Daten seien schlicht falsch. So hätte sich bei bestimmten Fitnessbändern gezeigt, dass zwar die Mittelwerte für die Pulsmessung stimmten. Aber bei Spitzenwerten könnten bei einer Anzeige von 120 Schlägen pro Minute in Wirklichkeit 150 vorgelegen haben.

Fächerübergreifende Forschung

Die Forscher im Exzellenzcluster wollen helfen, mit den Messdaten besser umzugehen. Auch Fehler zeigen Muster. „Wir entwickeln Fehlermodelle, die Diagnosen einschätzen“, sagt Conrad. So könne in Zukunft ein Algorithmus anzeigen, wie sicher die gefundene Diagnose ist.

Sein aus acht Personen bestehendes Team betreibe praxisorientierte Forschung sowie Grundlagenforschung, betont Tim Conrad. Allerdings seien viele der entwickelten Methoden noch weit von der Anwendungsreife entfernt. In MATH+ sieht er ein starkes Instrument, diesen Prozess zu beschleunigen: „Wir profitieren sehr davon.“ Nicht nur wegen der Fördergelder. Es finde ein so reger Austausch unter Fachkolleginnen und -kollegen statt, „wie ich ihn vorher nicht erlebt habe“, sagt der Bioinformatiker. So entstünden neue Ideen.

Auch die interdisziplinäre Zusammenarbeit werde gestärkt. „Um anwendbare Ergebnisse zu erzielen, müssen die späteren Anwenderinnen und Anwender – etwa aus der Medizin im Team – eingebunden sein“, hebt Conrad hervor. Christof Schütte pflichtet bei: „Die fächerübergreifende Forschung, die wir am Cluster betreiben, gibt uns viel mehr Möglichkeiten, in Gesellschaft und Politik hineinzuwirken.“