Zeitung Heute : Seismograf für die Stimmung im Internet

Foren und soziale Netzwerke sind eine Fundgrube für Marktforscher. Informatiker helfen, diese Ressource zu erschließen.

Katharina Jung
Angebot und Nachfrage. Nicht nur Lebensmittelhersteller fragen sich: Was denken Konsumenten über meine Produkte? Warum greifen sie zu – oder nicht? Die Antwort ist auch im Internet zu finden, in Foren und sozialen Netzwerken. Die Mia-Plattform soll diese Quelle verfügbar machen. Foto: Imago
Angebot und Nachfrage. Nicht nur Lebensmittelhersteller fragen sich: Was denken Konsumenten über meine Produkte? Warum greifen sie...

Ist Brad Pitt der richtige Werbeträger für ein Parfum? Welche nichtalkoholischen Getränke trinken Fans nach einem Fußballspiel im Winter? Beeinflusst der aktuelle Pferdefleischskandal die Einstellung der Kunden zu Fertigprodukten? Die Antworten auf solche Fragen können Marktforscher auch im Internet finden. Schließlich surfen mehr als 60 Millionen Menschen regelmäßig im deutschsprachigen Netz, hinterlassen ihre Spuren in unzähligen Foren, Webseiten und sozialen Netzwerken. Doch damit ist auch schon das Problem umrissen: Die Zahl der potenziellen Informationsquellen ist so gewaltig, dass man schnell den Überblick verliert.

„Besonders in Foren und sozialen Netzwerken finden sich vermutlich tausende Informationen, die im Moment keiner gezielt nutzen kann. Aus dieser Fülle unstrukturierter Daten gezielte Informationen zu gewinnen, ist für einzelne Unternehmen unmöglich“, sagt Alexander Löser, Leiter des Projektes „MIA – Marktplatz für Informationen und Analysen“, sowie Forschungsgruppenleiter am Fachgebiet Datenbanksysteme und Informationsmanagement der TU Berlin.

Zusammen mit fünf Partnern (Fraunhofer-Institut für Offene Kommunikationssysteme, Neofonie GmbH, ParStream GmbH, TEMIS Deutschland GmbH, VICO Research und Consulting GmbH) arbeitet Löser an einem vom Bundeswirtschaftsministerium geförderten Projekt zur Entwicklung eines deutschen Datenmarktplatzes. Auf einer Onlineplattform soll ein großer Teil der Inhalte des gesamten „.de-Webs“ nicht nur aktuell bereitgestellt werden, sondern auch angereichert mit Informationen über die Herkunft, den Inhalt und die sprachliche Struktur. Rund sechs Millionen Euro aus Förder- und Eigenmitteln werden in das Projekt investiert.

Derzeit umfasst das gesamte deutschsprachige Internet rund sechs Milliarden Webseiten. „Das Speichern, Verarbeiten und Analysieren von ,Big Data’ war bislang ein großes Problem“, sagt Löser. Durch die Übertragung und Adaption von Ergebnissen aus der Grundlagenforschung in Cloud Computing und Informationsmanagement ist es dem Konsortium jetzt gelungen, eine Art „Big-Data-Kaufhaus“ aufzubauen. „Auf der Mia-Plattform sind zurzeit die Daten von über 500 Millionen Webseiten gespeichert, geplant sind etwa eins bis zwei Milliarden Seiten“, sagt Löser. „Der Marktplatz eröffnet verschiedene Möglichkeiten: Wir liefern aktuelle Rohdaten, also zum Beispiel ein buntes Sammelsurium an Textdaten von sämtlichen deutschsprachigen Foren, aber auch aufgearbeitete Datensätze.“ Das könnten beispielsweise ausschließlich Daten aller Foren sein, die mehr als 100 aktive Nutzer haben, sagt der TU-Forscher. „Gleichzeitig listen wir Softwareanbieter, die komplette Anwendungen entwickeln, um aus den Daten ganz spezielle Informationen zu generieren.“

Ein Beispiel: Der Hersteller von Fertiglasagne möchte herausfinden, inwieweit seine Marke mit dem Pferdefleischskandal assoziiert wird und ob sich die Einstellung zu Fertiglebensmitteln nachhaltig verändert hat. Er instruiert einen IT-Dienstleister mit dem nötigen Fachwissen zu dem Unternehmen und vielleicht noch, welche Foren hauptsächlich Nahrungsmittelsicherheit behandeln. Der IT-Dienstleister entwickelt dann einen speziellen Algorithmus, der in der Lage ist, Informationen aus allen Foren, sozialen Netzwerken- und Webseiten zu extrahieren, auf denen sich der Produktname, damit assoziierte Stimmungen, aber auch Meinungen zu Nahrungsmittelsicherheit und Kennzeichnungsvorschriften finden. Diese Anwendung (App) durchsucht dann den gesamten Datenbestand der Mia-Plattform. Im Ergebnis erhält das Unternehmen ein aktuelles und umfassendes Stimmungsbild über die Wahrnehmung seiner Produkte in der deutschsprachigen digitalen Welt.

„Eine vergleichbare kommerzielle Untersuchung würde, je nach Fragestellung, einen fünfstelligen Euro-Betrag kosten“, sagt Löser. Der gesamte Datenbestand gehört im Moment dem Konsortium. Gehostet wird das „Datenkaufhaus“ von der TU Berlin. Während der Projektphase wird die Mia-Plattform nicht kommerziell genutzt. Langfristig streben die Partner jedoch eine private Ausgründung an.

Die Möglichkeit, die gesamten Daten des deutschsprachigen Internets mit geringen Investitionskosten zu nutzen, würde es nicht nur kleineren und mittleren Unternehmen erlauben, eigenständige Analysen vorzunehmen oder auch Nischen-Informationen zu ermitteln. Es ermöglicht auch neue Geschäftsmodelle. Die Plattform des Mia-Marktplatzes stellt den Datenbestand bereit, reichert ihn an und bereinigt ihn. In jeder Phase dieses Prozesses können neue Geschäftspartner einsteigen, diese Daten kaufen, selbst anreichern oder Mehrwertdienste in Form von speziellen Anwendungen entwickeln und diese wiederum auf der Mia-Plattform anbieten.

Die Wissenschaftler haben allerdings noch einiges zu tun. Zum einen wollen sie auf technischer Seite die parallele und schnelle Verarbeitung riesiger Datenmengen verbessern und zugleich semantische Technologien, die diese Daten auswerten, optimieren. Zum anderen stehen Datenschutz-, Urheberrechts- und Vertragsrechtsfragen auf der Agenda. „Wir verwenden ausschließlich öffentlich zugängliche Daten, die vom Serverbetreiber bereits für gängige Web-Suchmaschinen freigegeben wurden“, sagt Löser. „Gleichzeitig stellen wir sicher, dass sich die verdichteten Informationen nur auf Produkte und Unternehmen beziehen, da eine Zusammenführung von personenbezogenen Daten in Deutschland nicht erlaubt ist.“

Das Ziel der Wissenschaftler ist es, auch nach Auslauf der Förderung Ende 2014, eine zentrale Daten-Plattform für Deutschland zu erhalten. Mit acht „Alphapartnern“ aus der Industrie testet das Konsortium jetzt erste Anwendungen für die Bereiche Medien, Marktforschung und Beratung.

Tagesspiegel - Debatten


Hintergründe und Expertisen zu aktuellen Diskussionen: Tagesspiegel Causa, das Debattenmagazin des Tagesspiegels.

Hier geht es zu Tagesspiegel Causa!

0 Kommentare

Neuester Kommentar