Zeitung Heute : Digitales Schürfen im Datenbergwerk

MARIE-LUISE GOERKE

Neulich war es mal wieder soweit: Nach nur zwei Tagen Abwesenheit quoll der Briefkasten fast über - nicht wegen der Unmenge an Post, sondern wegen der Fülle an Werbewurfsendungen.Manchmal sind die Handzettel sogar interessant.Das passiert selten, kommt aber vor.Oft ist es gerade die persönlich adressierte Werbung, die ankommt.Das sogenannte "direct mailing" setzt natürlich zunächst voraus, daß die Empfängeradresse bekannt ist.Wer nun auch noch den Bezirk oder den Zustand des Wohnhauses berücksichtigt, kann noch gezielter werben.

Doch woher weiß der Werber, daß nun ausgerechnet dieses Produkt für Frau Meier interessant sein könnte und für Herrn Schulze nicht? Entweder hat der Absender einfach Glück gehabt, oder er hat "Data Mining" betrieben.Data Mining heißt eigentlich übersetzt "Daten schürfen".Doch Daten gibt es viele.Unzählige.Hier gilt es, die Spreu vom Weizen zu trennen.Das weiß jeder, der aus diesem Grunde schon einmal im Internet eine der Suchmaschinen beschäftigt hat.Je nach Abfragegeschick liefern Datenbankabfragen immerhin eine sinnvolle Vorauswahl.Die Voraussetzung aber ist, daß man weiß, wonach man sucht.

Beim Data Mining braucht man das nicht.Ungezielt suchen, nennt man das.Denn der Clou beim Data Mining ist die Analyse von riesigen Datenmengen, um noch unbekannte und nicht selten auch völlig unerwartete Zusammenhänge herauszufinden.Deswegen bezieht sich die Analyse-Technik Data Mining auch immer auf bereits vorhandene Daten."Es geht beim Data Mining nicht darum, einfach nur Daten zu gewinnen, sondern es geht um Informationen, und zwar um interessante, relevante Informationen", erklärt Martin Barghoorn von Fachbereich Informatik der TU Berlin.

Eine relevante Information für den freien Markt ist beispielsweise die Kundensegmentierung, also die Zusammenführung von Kundenadresse und Kundeninteresse.Denn Konsumenten gibt es viele.Hat man durch Data Mining erstmal herausgefunden, daß womöglich Migränepatienten überproportional häufig auch unter Magenschmerzen leiden, könnte man diese Verbindung genauer unter die Lupe nehmen, also segmentieren.Vielleicht stellt sich dann heraus, daß es vor allem berufstätige Frauen um die 30 sind, die unter den Kopfschmerzattacken leiden.Wenn sich nun auch noch entdecken läßt, daß diese Frauen weder Kosten noch Mühen scheuen, teure Medikamente zu erwerben, könnte man sicher jemanden finden, dem diese Information einiges wert sein wird.Ein fiktives Beispiel.Tatsache ist jedoch, daß überall dort, wo automatisch Daten erhoben werden, ein Datenschatz schlummert, der jederzeit mittels Data Mining gehoben werden könnte.Und auch gehoben wird.

Durch verschlüsselte E-Mails oder mit Sternchen versehene Adressenangaben in Newsgroups kann man sich vor dem Personen-Check versuchen zu schützen.Im Internet.Zahlt man irgendetwas per Kreditkarte, ist das schon schwieriger.Und selbst bei völlig anonymen Vorgängen, beispielsweise Barzahlung im Supermarkt, können zumindest noch die durch Scannerkassen erfaßten Produkte der Einkaufszettel auf mögliche Zusammenhänge untersucht werden.In der Bank, beim Arzt oder in Bibliotheken fallen automatisch Daten an, auch solche sehr persönlicher Natur.Sie alle könnten mittels Data Mining verknüpft und analysiert werden - und zwar prinzipiell sowohl zum Schaden als auch zum Nutzen des einzelnen.Um möglichen Mißbrauch auszuschließen, ist hier der Datenschutz gefordert."Man kann sich als einzelne Person so einfach und langfristig nicht grundsätzlich vor Data Mining schützen", erklärt Martin Barghoorn."Wichtig ist zumindest, daß ein Bewußtsein darüber entsteht, daß Data Mining existiert und über kurz oder lang auch angewendet werden wird."

In Deutschland hält sich die Informationstechnologie bei der Datenverbindungserkennung noch zurück.Noch, wohlgemerkt.In den USA ist das datenbasierte Marketing und somit auch die Analyse-Technik Data Mining schon lange kein Fremdwort mehr.So ist es vermutlich nur eine Frage der Zeit, bis das Datendiamantenfieber über den großen Teich geschwappt sein wird.

Die Datenmedaille hat allerdings zwei Seiten.Grundsätzlich bietet nämlich das leistungsfähige Analyseverfahren auch ungeheure Chancen und möglichen Nutzen für die Allgemeinheit.Man denke nur an die Sonderkommissionen zur Bekämpfung von Wirtschaftskriminalität.Wer sonst als ein Computer könnte die allein nur täglich getätigten, unzähligen Transaktionen auf Unregelmäßigkeiten sinnvoll untersuchen? Die Suche nach noch unbekannten Zusammenhängen in den Datenbergen war aufgrund mangelnder Rechnerkapazitäten bis vor einigen Jahren gar nicht oder nur unzureichend möglich.Heute ist man da schon weiter.

Tagesspiegel - Debatten


Hintergründe und Expertisen zu aktuellen Diskussionen: Tagesspiegel Causa, das Debattenmagazin des Tagesspiegels.

Hier geht es zu Tagesspiegel Causa!

0 Kommentare

Neuester Kommentar