zum Hauptinhalt

Gesundheit: „Jeder Forscher wird eigene Suchmaschine haben“

Autonom und individuell ausgerichtet: Gerhard Weikum über zukünftige Spürnasen des Internets

Herr Weikum, Sie entwickeln Suchmaschinen. Wann werden Sie Milliardär?

Dafür bin ich zu idealistisch. Außerdem gehört viel Glück dazu. Auf die Erfolgsstory von Larry Page und Sergey Brin, die Google-Gründer, kommen ja Tausend andere, die es nicht geschafft haben. Die waren aber auch nicht dümmer.

Was macht Suchmaschinen finanziell so attraktiv?

Die Werbung macht den Löwenanteil der Einnahmen aus. Der Jahresumsatz mit Werbung im Internet beträgt derzeit etwa zehn Milliarden Dollar. Die Hälfte davon entfällt auf „sponsored ads“ in Suchmaschinen. Diese speziellen, separat ausgewiesenen Treffer sind von den Firmen bezahlte Anzeigen.

Wenn man bei den etablierten Suchmaschinen wie Google ein Stichwort eingibt, erhält man in Sekundenschnelle Tausende von Treffern. Warum geht das so effektiv?

Google arbeitet sehr schnell bei Stichwörtern, über die es viele Informationen gibt, etwa über einen Popstar. Dafür wird auch eine Menge Hardware eingesetzt. Google hat über 100 000 Computer weltweit und ein Repertoire exzellenter Techniken, um unter den vielen Informationen die guten rauszufischen.

Was gibt es dann bei Suchmaschinen noch zu verbessern?

Wenn man spezielles Wissen sucht, etwa als Forscher oder Journalist, über ausgefallene Hobbys oder seltene Krankheiten, erhält man nicht so viele Treffer. Dann lässt sich die Anfrage auch nicht mit wenigen Schlüsselwörtern beschreiben. Schwächen zeigen sich, wenn man ein Thema gründlich analysieren oder Diskussionen über eine gewisse Zeit verfolgen will. Auch wenn Sie schon ein relativ großes Vorwissen haben, sagen die ersten Hundert Treffer von Google oder Yahoo wahrscheinlich nichts Neues mehr. Diese Suchmaschinen sind für diese Art von Anfragen nicht entworfen.

Ihr Saarbrücker Max-Planck-Institut für Informatik hat einen hohen Page-Rank bei Google. Was bedeutet das?

Das ist nach Larry Page, einem der Gründer von Google, benannt. Das Prinzip ist: eine Seite ist gut, wenn sie oft empfohlen wird. Eine Empfehlungen ist ein Hyperlink, kurz Link. Der Page-Rank kennzeichnet also die Anzahl der Empfehlungen. Dabei gilt, dass eine Empfehlung besonders viel wert ist, wenn sie von einer Seite kommt, die selbst einen hohen Page-Rank hat.

Ihr Team entwickelt die Software von Suchmaschinen weiter. Nach welchen Strategien funktioniert das?

Einmal reichern wie die Daten selbst an. Wir versuchen also, Texte, Bilder und Links genauer zu analysieren. Wir verknüpfen die Seiten mit Hintergrundwissen, untersuchen die Struktur der natürlich sprachlichen Sätze und extrahieren Fakten daraus. Auf diese Weise wollen wir die Daten besser auffindbar machen. Wir können so auch eventuelle Mehrdeutigkeiten klären. Wenn etwa der Begriff „Paris“ auftaucht. Ist damit die Person aus der Ilias gemeint oder die Stadt?

Oder Paris Hilton!

Ja, auch die. Wir können festlegen, hier ist die Stadt, die Hotelerbin oder die mythologische Figur gemeint. Das geht nicht nur für einzelne Konzepte, sondern auch für Beziehungen zwischen Konzepten. Diese Technik nennt man Text-Mining. Man kann alles Mögliche herausbekommen: wer hat was erfunden, wer hat wen getroffen, an welchem Tag, an welchem Ort.

Kann man nicht auch die Nutzer selbst einbeziehen?

In der Tat. Nutzer geben beim Suchvorgang eine Menge Input. Sie formulieren eine Anfrage, bekommen viele Treffer und lesen die Zusammenfassungen. Dann klicken sie etwa auf Treffer Rang drei, aber nicht auf Rang eins oder zwei. Damit haben sie eine vorläufige Wertung abgegeben, die sie vielleicht später, wenn sie die ganze Seite sehen, wieder korrigieren. Ein solches Relevanz-Feedback kann man auch in expliziter Form abgeben, indem man eine Seite etwa durch fünf wichtige Schlüsselbegriffe charakterisiert.

Kann man auch Suchmaschinen entwickeln, die auf die Bedürfnisse des einzelnen Benutzers abgestellt sind?

Ja, indem man Menschen mit speziellen Interessen, beispielsweise Wissenschaftler, Informatikstudenten oder Journalisten zusammenfasst. Wir würden wissen, welche Anfragen sie weltweit gestellt haben und welche Treffer sie unter den Top Zehn angeklickt haben. Dann bekommen wir indirekt so etwas wie „Massenverstand“. Das können wir nutzen, beispielsweise um zehn bessere Toptreffer zu berechnen. Man kann es dann auf das Individuum weiter herunterbrechen. Das System berücksichtigt, welchen Wissenshintergrund der einzelne Benutzer hat, welche Themen er bevorzugt. Eine solche personalisierte Suche kann viel bessere Resultate bringen.

Gibt es Engpässe bei der Entwicklung von Suchmaschinen?

Ein Engpass ist die inhärente Unschärfe, die in Texten steckt. Wenn Sie etwas ironisch formulieren, wird kein Rechner der Welt herausfinden, dass Sie in Wirklichkeit das Gegenteil von dem meinen, was Sie sagen. Auch beim Formulieren der Suche gibt es Ungenauigkeiten. Wir wollen ja nicht erst lange darüber grübeln, wie wir ganz präzise unser Suchbedürfnis ausdrücken können. Diese Unschärfe ist weder bei den Daten noch bei der Benutzerinformation völlig zu beseitigen. Deshalb wird es nie eine perfekte Suchmaschine geben. Auch in 100 Jahren wird man nicht erwarten können, immer – egal wie schlampig die Anfrage formuliert ist – auf den Punkt genau die gewünschten Informationen zu bekommen.

Wann wird Ihre Suchmaschine auf dem Markt sein?

Die Software wird als „open source“ verfügbar sein. Wir haben bestimmte Werkzeuge ins Netz gestellt, die man gratis runterladen kann Sie sind mit der im „open source“ üblichen Nichtkommerzialisierungslizenz versehen. Wir wollen die Software erst mal unter die Leute bringen. Das ist mir am wichtigsten, dass unser Know-how die Welt voranbringt.

Wie werden Suchmaschinen in zehn, 20 Jahren aussehen?

Die werden vielleicht an der Oberfläche nicht mehr sichtbar, sondern in Anwendungen eingebettet sein. Der Nutzer merkt möglicherweise gar nicht mehr, dass etwas gesucht wird. Zum Beispiel wird sich das Handy wie eine Art intelligenter Assistent verhalten. Sie sitzen vielleicht in einem Meeting, und das Handy analysiert die Gesichter der Teilnehmer und gibt Hintergrundinformationen über diese. Die andere Richtung ist Personalisierung. Man wird ausnutzen, dass Millionen von Menschen mit diesen Diensten interagieren. Daraus lassen sich Erkenntnisse ziehen, die dann bei der Trefferberechnung und dem Ranking von schwierigeren Abfragen berücksichtigt werden.

Welche individuellen Informationen bekommt man?

Man kann viele spezifische Details ermitteln. Welche Anfragen hat der Nutzer gestellt, worauf hat er geklickt? Google und Yahoo sammeln bereits solche Daten. Die werden das nicht individuell auswerten, sondern für statistische Analysen ausnutzen, um vielleicht noch geschickter spezifische Werbung machen zu können. Denn im Internet kann man genau verfolgen, wie Werbung wirkt. Man kann feststellen, ob jemand etwas gekauft oder welche Produktseiten er besucht hat.

Wird man nicht zum gläsernen Menschen?

Um das zu verhindern, sollte man nicht nur mit drei Giganten unter den Suchmaschinen arbeiten. Wir sollten besser Hunderte oder Tausende von Suchmaschinen haben, die untereinander ein Netzwerk aufbauen. Das reduziert das Risiko bezüglich der Privatsphäre. Jeder Wissenschaftler könnte seine eigene Suchmaschine haben. Forscher haben spezialisierte Bedürfnisse, wollen diese aber nicht alle preisgeben, auch weil sie im Wettbewerb stehen. Mit den Werkzeugen, die wir entwickeln, lässt sich kontrollieren, wie weit das eigene Verhalten für andere nutzbar gemacht werden soll.

Das Gespräch führte Paul Janositz

Gerhard Weikum (49) ist Direktor am Max-Planck-Institut für Informatik (mpii) in Saarbrücken. Er war Professor an der ETH Zürich und lehrt seit 1994 auch an der Universität Saarbrücken.

-

Zur Startseite

showPaywall:
false
isSubscriber:
false
isPaid:
showPaywallPiano:
false