Zeitung Heute : der findet Wer , Was Google macht

Im Internet steht fast alles - auf Milliarden Seiten. Suchmaschinen helfen in Sekunden beim Blättern. Und nicht immer ist Google die Beste.

Markus Ehrenberg

Wann wurde Kennedy ermordet? Wie finde ich ein Ferienhaus mit Kamin auf Hiddensee? Wo wohnt meine ehemalige Schulfreundin? Was macht mein zukünftiger Arbeitgeber? Und: Wo steht das alles so detailliert und profund, dass ich mich auf die Information auch verlassen kann?

Seit es Internet-Suchmaschinen gibt, die in Sekundenschnelle die passende Website und die gewünschten Informationen zu einem beliebigen Thema aus dem Cyberspace fischen, muss man sich solche Fragen nicht mehr lange stellen. Vor allem: seit es Google gibt. 200 Millionen Mal täglich wird gegoogelt. Google ist zum monopolisierten Wissensportal zur Welt geworden.

Suchen und finden – dafür ist „googeln“ zum Synonym geworden, eine neue Vokabel der Umgangssprache ist entstanden. Rund 4,3 Milliarden Webseiten kennt Google. Keiner kennt mehr. Google gibt eine ziemlich profunde, kommentierte Ergebnisliste mit Links zum Begriff heraus (zum technischen Verfahren siehe Kasten), sofort zum Anklicken. Und jetzt will Google auch noch an die Börse. Was bei dieser populären Riesen-Maschine nicht herauskommt, das kann auf dieser Welt eigentlich gar nicht existieren, scheinen die meisten Benutzer zu denken. Allerdings sind manche Suchanfragen bei Google gar nicht so gut aufgehoben. Es gibt immer mehr Konkurrenz, und die ist gar nicht mal so schlecht.

Das beweisen Suchtests. Seit Anfang des Jahres ist der (schon ältere) Internet-Dienstleister Yahoo drauf und dran, wieder eine echte Alternative zu werden, mit dem eigenen Suchdienst yahoo.com. Was gibt es bei Yahoo, was Google nicht hat? Zum Beispiel alle Dateitypen . Google findet neben „normalen“ Webseiten, die auf der Internetsprache html beruhen auch „PDF“- oder „doc“-Dokumente. PDF-Dateien beinhalten oft elektronische Publikationen wissenschaftlicher Dokumente (Dissertationen, Diplomarbeiten). Darüberhinaus findet Yahoo auch „.xml“- und „.txt.“-Dateien. Das kann helfen, eine wissenschaftliche Arbeit oder ein nicht unbedingt für die Öffentlichkeit gedachtes, aber trotzdem veröffentlichtes Dokument zu sichten.

Häufiger wird im Netz nach Reisen gefragt. Eine Stichprobe. Wir wollen nach Hiddensee. Das Wort „Hiddensee“ eingegeben. Google listet 117000 Treffer auf – und Yahoo 141000. Nun kommt bei viel nicht immer das Beste heraus. Stichwort: Relevanz, die Nagelprobe für jede Suchmaschine. Der Vorteil bei Google: Bei Reiseanfragen sind die sonst nervigen kommerziellen Anzeigen rechts neben der Trefferanzeige einmal willkommen. Neben dem Web-Verzeichnis stehen dann praktischerweise die Internet-Adressen der wichtigsten Reiseveranstalter oder sogar konkrete Angebote. Da ist man schnell beim Häusergucken und Buchen. Das hat Yahoo nicht.

Ob aber nun Reisen, Autos, Häuser, Informationen oder Liebe – generell gilt für alle spezielle Anfragen: Eine Internet-Suchmaschine kann nur helfen, die entsprechenden Angebotsseiten schneller zu finden, für die Partnersuche zum Beispiel „parship.de“ oder „neu.de“. Inwiefern sich hinter dem Hauptportal „neu.de“ mit seinen zig weiterführenden Seiten wirklich der potenzielle Partner fürs Leben verbirgt, das weiß die beste Suchmaschine der Welt nicht. Auch nicht Google.

Eine weitere Alternative ist die Suchmaschine „metager.de“ der Universität Hannover, eine Art Meta-Suchmaschine , die für eine Anfrage gleich mehrere andere deutschsprachige Suchmaschinen durchforstet. Eine gute Adresse für etwas abseitigere Abfragen und Ergebnisse, gerade auch, weil Quasi-Monopolist Google einmal nicht berücksichtigt wird, dafür aber rund 30 andere, kleinere Suchmaschinen. Sobald die einzelnen Internet-Fahnder mit der Suche fertig sind, werden die Treffer für den Kunden bei Metager wieder zusammengefasst.

Der Nachteil: Man wird bei Metager mit einem Super-Such-Ergebnis fast erschlagen. Es ist wie immer im Leben. Zuviel Antworten sind auch nicht gut. „Sie haben SEHR viele Ergebnisse erhalten“, antwortet Metager auf den Suchbegriff „Hiddensee“. Und: Möglicherweise sei es sinnvoll, die Anfrage zu verfeinern. Aber das kann man ja dann auch wieder bei Google tun, indem man eine der praktischen Adressen aus der Ergebnisliste aufsucht (zum Beispiel www.hiddenseeferien.com). Und bucht.

Googles Erfolgsgeschichte begann vor gut sechs Jahren. Damals war Altavista noch die Nummer Eins, gefolgt von AlltheWeb. Dieser Netz-Fahnder hat derzeit immerhin auch über zwei Milliarden Webseiten in der Datenbank. Aber es gibt im Cyberspace ja nicht nur Texte und Internet-Seiten. Sondern auch viel Musik und Filme . Wer nach Bildern, Video-Clips oder – legalen – MP3-Files sucht, ist bei „alltheweb.com“ richtig. Es braucht allerdings ein bisschen Geduld, um über Suchmaschinen abspielbare Musik zu finden und zu hören. Wer beispielsweise den Begriff „Morrissey“ bei Alltheweb (unter: Audio) eingibt, landet oft eher bei verstaubten Seiten denn bei verwertbarem Material. Übrigens: MP3-Dateien, die sich gratis kopieren und herunterladen lassen, finden sich sicher nicht über Suchmaschinen, sondern direkt bei illegalen Musiktauschbörsen.

Eine Faustregel sollte man sowieso beachten. Suchmaschinen, auch Google, erfassen höchsten 30 Prozent aller Webseiten im Internet. Es lohnt sich also immer, nicht nur bei Google vorbeizuschauen.

Die Idee. Eine Suchmaschine, die die Ergebnisliste danach sortiert, wie relevant die gefundenen Seiten sind – diese Idee kam den Studenten Larry Page, 31, und Sergey Brin, 30, 1998 an der Universität Stanford (Kalifornien). Am Anfang stand ein Grundkapital von 100000 Dollar. Mittlerweile macht Google mehr als 100 Millionen Dollar Gewinn im Jahr, vor allem mit dem Verkauf von Lizenzen für Such-Technologie und Anzeigen.

Die Geheimformel. Die Formel, nach der bestimmte Webseiten auf der Ergebnisliste ganz oben erscheinen, hält Google so geheim wie Coca Cola sein Limonadenrezept. So genannte Suchroboter („search robots“), die von der Firmenzentrale in Mountain View/Silicon Valley aus gesteuert werden, arbeiten sich durch das World Wide Web und sichten Milliarden von Webseiten. Findet sich das Suchwort (zum Beispiel „Hiddensee“) auf einer Website mehrmals oder in einer vom übrigen Text abgesetzten Schrift, kommt diese Seite im Ranking weiter nach oben auf die Ergebnisliste. Dazu kommt das Verweisungsprinzip, die Link-Popularität . Je öfter Homepages auf eine andere hinweisen, desto höher wird diese Seite auf der Ergebnisliste stehen. Steht bei Google nach einer Anfrage „hiddensee.de“ ganz oben – und vor „insel-hiddennsee.de“ zum Beispiel –, kann man davon ausgehen, dass die Suchroboter im Cyberspace mehr Webseiten gefunden haben, die auf „hiddensee.de“ verweisen als auf „insel-hiddensee.de“. Die Google-Macher erklären dieses Phänomen mit Relevanz.

Die Kritiker bemängeln, dass das Google-Prinzip Manipulationen am Such-Ergebnis zulässt, wenn die Betreiber von Webseiten zum Beispiel absichtlich, ohne jeden substanziellen Grund hundertfach auf andere Webseiten verweisen und diese dadurch künstlich aufwerten, also populärer machen (siehe Interview). Google entgegnet, dass sein (geheimer) „Linkbewertungs-Algorithmus“ solche Tricksereien berücksichtige. Man kann jedoch in der Regel davon ausgehen, dass die ersten Seiten auf der Liste die ergiebigsten sind.

Weitere Funktionen auf google.de. „Google News“ bringt auf eine Schlagwortsuche hin (zum Beispiel „Irak-Krieg“) die aktuellsten Nachrichten (in der Reihenfolge ihres Erscheinens bei anderen Medien). „Google Groups“ verzeichnet alte Debattier- oder Chatbeiträge , die früher gesondert im Netz standen und sonst nirgends mehr zu finden sind. Das könnte beispielsweise nützlich sein für soziologische Arbeiten. Der neue, kostenlose E-Mail-Dienst „GMail“, der einen in den USA einzigartigen Speicherplatz von einem Gigabyte anbietet, ist allerdings ins Gerede gekommen. Es heißt, die E-Mails der Kunden würden für die Platzierung von Werbung nach Schlüsselbegriffen durchsucht („Urlaub“, „Auto“ etc.). Das verstößt für viele Datenschützer gegen geltendes Recht.meh

Hintergründe und Expertisen zu aktuellen Diskussionen: Tagesspiegel Causa, das Debattenmagazin des Tagesspiegels.

Hier geht es zu Tagesspiegel Causa!

0 Kommentare

Neuester Kommentar