zum Hauptinhalt
Der Mensch, die Summe seiner Metadaten. Der NSA-Skandal hat das Bewusstsein für die informationelle Moral geschärft.

© REUTERS

Big Data: Mach’ dir ein Bild von mir

Die Veredelung von Informationen zu Wissen klingt im digitalen Zeitalter wie eine Verheißung. In den USA investieren Unternehmen massiv in Big-Data-Lösungen. In Deutschland wächst der Markt.

Die Meldung ging in der Aufregung um die Spähaktionen des amerikanischen Geheimdienstes NSA beinahe unter: Mehrere Zeitungen und Onlinedienste berichteten kürzlich, der Kapitalfonds „Data Elite“ wolle „Big Data“-Startups im Silicon Valley mit einem Anfangskapital in Höhe von 150 000 Dollar ausstatten. Der Fond wird von berühmten Investoren wie Ron Conway, Andreessen Horowitz und Joe Lonsdale unterstützt. Data Elite stellt für innovative Unternehmensgründer Arbeitsflächen von 10 000 Quadratmeter zur Verfügung. „Wir wollen eine Big-Data-Community gründen“, sagte Mitbegründer Stamos Venios. Nun muss man wissen, dass der Begriff „Big Data“ in den USA, vor allem in Geschäftskreisen, keineswegs negativ konnotiert ist. Mit Big Data sind große Hoffnungen verbunden. Denn: Die Analyse großer Datenmengen erzeugt wirtschaftlichen Nutzen.

Längst ist auch in Deutschland die Erkenntnis gereift, dass Daten einen Wertschöpfungsfaktor darstellen – etwa im Bereich Logistik oder Risikocontrolling. Der Branchenverband Bitkom schreibt in seinem Leitfaden „Big Data im Praxiseinsatz – Szenarien, Beispiele, Effekte“: „In der digitalen Welt treten Daten als vierter Produktionsfaktor neben Kapital, Arbeitskraft und Rohstoffe.“ Die Datenmenge im Internet ist zwischen 2005 und 2012 um sage und schreibe 1696 Prozent auf 2,7 Zetabyte angewachsen – eine Zahl mit 21 Nullen. Und die Kurve geht weiter steil nach oben. Die jährliche Traffic-Rate soll nach Angaben von Cisco Systems und dem US-Bureau of Economic Analysis bis 2017 jährlich um 177 Prozent wachsen. Die Herausforderung besteht darin, „Big Data“ in „Smart Data“ zu transformieren – also in Daten, die etwas aussagen.

Unter dem Stichwort „Analytics“ kursieren im Silicon Valley mannigfaltige Konzepte, die Metadaten aus dem Netz entschlüsseln sollen. Auf der Plattform „big data-startups“, ein loser Interessenverband, können sich die Unternehmensgründer mit ihren Ideen austauschen. Das Start-up „Aureus Analytics“ preist Daten als das „neue Gold“. Die Firma Kaggle mit Sitz in San Francisco wirbt mit dem Slogan „Wir machen aus Datenwissenschaft einen Sport.“ Und die Internetfirma „Infinitive Analytics“ frohlockt mit der Losung „Big Data, Deep Insights“. Im Land der unbegrenzten Möglichkeiten sind dem Datensammeln keine Grenzen gesetzt. Die Beratungsgesellschaft McKinsey schätzt, dass das Geschäft mit den Daten in den USA im Jahr 2020 ein Volumen von 325 Milliarden US-Dollar erreichen wird.

Laut Bitcom werden 27 Prozent der globalen Umsätze mit Big-Data-Lösungen in Europa generiert. Auf deutsche Unternehmen entfällt derzeit nur ein Fünftel der Big-Data-Umsätze. „Während andere Länder beim Big-Data-Einsatz voranpreschen, verhalten sich deutsche eher wie Mittel- und Langstreckenläufer“, heißt es in dem Leitfaden. Das aber werde sich rasch ändern, prognostiziert der Branchenverband. Bis zum Jahr 2016 werden hierzulande rund die Hälfte der europäischen Big-Data-Umsätze erwirtschaftet. Datenaufholjagd in Deutschland. Das wirft Fragen auf: Darf man auf einem grundrechtssensiblen Terrain ungehemmt Gewinnen hinterherrennen? Bleibt der Datenschutz am Ende auf der Strecke?

Eine Firma will bereits 200 Millionen Nutzer identifiziert haben

Der Blick in die USA ist lehrreich – in vielerlei Hinsicht. Die Firma Drawbridge ist eines der diversen Start-ups in Kalifornien, die die Suchpfade der Internetnutzer aufspüren. Mithilfe von Cookie-Abgleichen und statistischer Triangulation kann das Nutzungsverhalten auf verschiedenen Geräten rekonstruiert werden. Und das obwohl, die Geräte gar nicht miteinander vernetzt sind (etwa über Cloud). Das Start-up gibt an, auf der Grundlage seines Algorithmus bereits 200 Millionen Nutzer identifiziert zu haben. „Wir beobachten ihr Verhalten und verbinden es mit ihren Mobilgeräten“, sagt CEO Eric Rosenblum in unverhohlener Deutlichkeit. Es klingt wie eine finstere Drohung aus einem Science-Fiction-Film. Zwar beteuert das Unternehmen in einem neuen „Praxiscode“, die Profile würden anonymisiert. Glaubhaft ist das aber nicht. Erst im Sommer kündigte der US-Telekommunikationskonzern AT&T an, dass er aggregierte Kundendaten verkaufen würde. Allein, die Meldung versandete im Nachrichtengetriebe. „In den USA gibt es keine Restriktionen für die Verwendung von Daten“, sagt die Datenschutzexpertin Jennifer King von der UC Berkeley School of Information. „Ohne klare rechtliche Regelungen für die Sammlung und Nutzung von Daten werden wir uns auf einen Punkt zubewegen, an dem Dritte eine erstaunliche Menge über unsere Präferenzen und Aktivitäten wissen.“

Auch die New Yorker Firma eXelate bietet personenbezogene Daten zum Verkauf an. „Auto, Reisen, Shopping, Gartenarbeit, Technologie, Unterhaltung, Finanzen – wenn Kunden danach suchen, haben wir es schon“, heißt es auf der Website. Durch die Methode des Trackings kann das Konsum- und Kommunikationsverhalten detailliert nachgezeichnet werden – jeder Klick ist wie ein Fußabdruck. Zwar verweist das Unternehmen auf die Privatsphäre der Verbraucher. Doch die Argumentation ist verquer. „Die gezeigten Daten stellen Informationen dar, die auf Grundlage eines Computers und nicht eines einzelnen Nutzers gesammelt wurden.“ Als würden dafür andere Regeln gelten.

Und plötzlich errechnet ein Algorithmus aus dem Kaufverhalten eine Schwangerschaft

Welche Blüten die Sammelwut treibt, zeigt ein Fall aus dem Jahr 2012. Die Analysten der Einzelhandelskette Target schlossen aus dem Kaufverhalten einer Kundin, dass sie schwanger war – und wussten dies vor ihrem Lebensgefährten. Die Algorithmen puzzelten die Produkte Mineralien, Zink und parfümfreie Seife – ein für werdende Mütter offenbar übliches Kaufverhalten – zusammen und errechneten daraus eine Schwangerschaftswahrscheinlichkeit. Das Verstörende an der Geschichte ist, dass Target niemals Daten über die Schwangerschaft seiner Kunden erhoben hat, sondern dies aus einer Verknüpfung bestimmter Produkte und findiger Algorithmen herleiten konnte. Das Unternehmen konnte sich eine soziale Begebenheit erdenken, ohne sie jemals gesehen, geschweige denn erschnüffelt zu haben. Das Problem: Datenschutzregime würden in diesem Fall leerlaufen, denn die Privatsphäre der Frau wurde formell nicht verletzt. Darin liegt aber die Natur von Big Data – die Algorithmen errechnen aus der schieren Menge von Daten Wahrscheinlichkeiten, die mit immer größerer Genauigkeit auf die Lebenswirklichkeit zutreffen.

Das Start-up Infinitive Analytics will mit seinen ausgefeilten Analyseprogrammen das Internetverhalten bis in die letzten Winkel ausleuchten und ein Psychogramm der Nutzer entwerfen. Wer sind sie? Was denken sie? Was wollen sie? Auf dem Internetauftritt ist ein menschlicher Körper zu sehen, dessen Beine zu einer DNA-Helix verknotet sind. Die DNA-Bausteine repräsentieren Informationspartikel, sichtbar für jeden. Es ist der gläserne Bürger. „Das Social Genomix analysiert nicht nur den Nutzer durch seine sozialen Netzwerke, um ein Genom oder eine 360-Grad-Ansicht zu zeichnen, sondern nutzt auch NLP, maschinelles Lernen, semantische und prognosefähige Technologien, um vorauszusagen, wonach der Nutzer auf einer Seite Ausschau hält, um es dann mit dem Produktkatalog der Seite abzugleichen.“ 95 Millionen Nutzer wurden nach Angaben von Infinitive Analytics auf diesem Wege gescannt. Und die Methoden werden immer ausgefeilter.

Der Bedarf ist mittlerweile so groß, dass die renommierte Hochschule HEC Paris einen neuen MBA-Studiengang für Big Data und Analysefähigkeiten einführt. Gesponsert wird der Studiengang von IBM – der Softwarehersteller hat erst vor kurzem seine Big-Data-Plattform präsentiert. Daten sind die wichtigste Ressource unserer Wissensökonomie. Dass sich hinter dem Kapitalfonds „Data Elite“ Unternehmen wie Facebook, LinkedIn, Yahoo und Zynga verbergen, überrascht vor diesem Hintergrund nicht.

Adrian Lobe

Zur Startseite

showPaywall:
false
isSubscriber:
false
isPaid:
showPaywallPiano:
false