Statistik : Computer erschaffen Gespenster

Big Data ermöglicht es, beim Stöbern in Datenbanken auf unbekannte Zusammenhänge zu stoßen. Aber die können sich als zufällig erweisen. Ein Kommentar.

Hartmut Wewetzer
Beispiel Festplatte: Gewaltige Speichermengen und Computerkapazitäten ermöglichen es, unbekannte statistische Zusammenhänge aufzudecken.
Blauer Dämon. Gewaltige Speichermengen und Computerkapazitäten ermöglichen es, unbekannte statistische Zusammenhänge aufzudecken.Foto: Imago

Alles hängt bekanntlich mit allem zusammen. Fragt sich bloß, wie. Im Zeitalter von Big Data und unermesslicher Computerpower liegen jede Menge Antworten auf der Hand. Sie lauten: Finde in den Datenbanken Zusammenhänge zwischen verschiedenen Ereignissen und Trends. Verbindungen, die dir früher entgangen wären. Je mehr Daten, umso mehr Zusammenhänge!

Beispiele gefällig? Der Genuss von Bionahrung und die Zunahme von Autismus hängen zusammen. Ebenso wie der Pro-Kopf-Verbrauch von Käse und die Zahl der Menschen, die in ihrem Bettzeug ersticken. Ähnliches gilt für die Gefahr, in seinem Swimmingpool zu ertrinken, und der Zahl der Filme, in denen Nicolas Cage auftritt.

Wirklich rätselhaft ist aber, warum die Scheidungsrate im amerikanischen Bundesrat Maine aufs engste mit dem Pro-Kopf-Verbrauch von Margarine in den USA gekoppelt ist.

Beispiele wie diese finden sich etwa auf der Website „Spurious Correlation“, auf der bizarre Scheinzusammenhänge versammelt sind. Kritiker führen damit die großspurigen Behauptungen mancher Big-Data-Vertreter ad absurdum. Es genügt eben nicht, wie von diesen behauptet, einfach den Rechenknecht mit Daten vollzustopfen, um am Ende auf aufregende neue Erkenntnisse und Verknüpfungen zu stoßen (die in Wahrheit oftmals keine sind).

Auch beim Umgang mit den Ergebnissen von Computerkalkulationen sollte man eine gesunde Portion Skepsis walten und sich nicht das Denken abnehmen lassen. Der Schlaf der Vernunft erzeugt Gespenster der Statistik. Umso mehr, als die Verlockung groß ist, so lange in den Datenbanken zu stöbern, bis man das erwünschte Ergebnis gefunden hat. Frei nach dem Motto: Glaube keiner Statistik, die du nicht selber gefälscht hast.

Natürlich ist es nicht ganz fair, sich hier nur über Auswüchse von Big Data lustig zu machen. Das Problem gibt es schließlich, seit es Statistiken gibt. Es lässt sich in dem Satz zusammenfassen, dass statistische Zusammenhänge (Korrelationen) längst nicht immer auch ursächlicher Natur sind. Oft beruhen sie auf Zufällen oder auf weiteren Faktoren, die im Hintergrund stehen, aber die wahren Ursachen sind. Legendär ist etwa die scheinbare Verbindung zwischen dem Rückgang der Störche und der schwindenden Geburtenrate. Mit Meister Adebar werden auch die Kinder seltener.

Zu wenig Schlaf lässt das Gehirn schrumpfen - oder ist es umgekehrt?

Besonders gravierend ist das Risiko scheinbarer Zusammenhänge in der Medizin. Geht es hier doch häufig darum, einen bestimmten Krankheitsauslöser, einen Risikofaktor oder im Gegenteil ein Heilmittel oder einen Schutzfaktor zu finden. In vielen wissenschaftlichen Untersuchungen stehen Korrelationen, stehen Ursache und Wirkung im Zentrum. Vor Kurzem etwa veröffentlichten Wissenschaftler der Berliner Uniklinik Charit eine Studie, in der sie eine statistische Verbindung zwischen der Zunahme der Impfquote und der Abnahme des plötzlichen Kindstods entdeckt zu haben glaubten. Der Nutzen der Impfung steht außer Frage, aber dass sie auch gegen den plötzlichen Kindstod helfen soll (dessen Ursache bis heute ungeklärt ist), ist womöglich doch zu weit hergeholt. Auch wenn die Statistik dafür spricht.

Lässt schlechter Schlaf, wie eine andere Untersuchung behauptet, das Gehirn schrumpfen? Oder schlafen die Leute ganz einfach schlechter, weil ihr Hirn schwindet? Oder hat beides eine unbekannte gemeinsame Ursache? Solche Fragen erfordern tief greifende Recherchen – eine Korrelation ist eigentlich nur der Anfang. Ähnliches gilt für die immer wieder geäußerte Behauptung, dass ein aktiver Lebensstil geistigen Abbauerscheinungen vorbeugt. Statistisch gesehen stimmt das. Und populär sind solche Annahmen auch, weil sie uns Macht über unser Schicksal versprechen. Aber vielleicht sind Ursache und Wirkung vertauscht: Wer fit im Kopf ist, nimmt mehr am Leben teil.

Es ist oft ungeheuer schwierig, im Heuhaufen belangloser Korrelationen jene kostbare Stecknadel zu finden, die eine wahre Ursache darstellt. Anders als es scheinen mag, sind solche Funde nicht die Regel, sondern die Ausnahme. Doch es gibt sie. Wie etwa die „Britische Ärzte-Studie“, die ein halbes Jahrhundert währte, einen klaren und ursächlichen Zusammenhang zwischen Rauchen und Lungenkrebs offenbarte – und die meiste Zeit ganz ohne Computer auskam.

46 Kommentare

Neuester Kommentar