Der „Kölner Express“ hat eine neue Mitarbeiterin: Klara Indernach. Die rasende Reporterin schreibt unter dem Kürzel „KI“ über Spritpreise, Schlagerstars und Marihuana-Plantagen. Auf dem Profilbild lächelt dem Leser eine junge Frau mit blonden Haaren entgegen.

Doch dahinter steckt kein Mensch, sondern ein Computer. „Klara Indernach ist der Name für Texte, die wir mit Hilfe Künstlicher Intelligenz erstellen“, heißt es im Profil. Das Foto sei mit dem Bildgenerator Midjourney erstellt worden. Das erfährt der Leser aber nur, wenn er auf den Link in der Autorenzeile klickt. Erst ganz unten findet sich ein Transparenzhinweis: „Dieser Text wurde mit Hilfe Künstlicher Intelligenz erstellt, redaktionell bearbeitet und geprüft.“

Dürftige journalistische Qualität

Die Texte, die Klara Indernach schreibt, sind von dürftiger journalistischer Qualität: Die KI sampelt Informationsschnipsel zusammen und stellt keine kritischen Nachfragen. Doch es ist kein Einzelfall. Im Netz wimmelt es von Webseiten, die komplett mithilfe von Künstlicher Intelligenz zusammengebaut wurde. Titel, Fotos, Texte – alles aus dem Automaten. Auch hier finden sich Namensbeiträge fiktiver Autoren, deren Profilfotos mit Bild-KIs erstellt wurden.

Die Organisation NewsGuard hat in einer Untersuchung hunderte KI-generierter Nachrichtenseiten im Netz gezählt, die vollautomatisiert Artikel in verschiedenen Sprachen produzieren: von Arabisch über Koreanisch bis Thai. Die algorithmengetriebenen Info-Schleudern hauen zum Teil über 1000 Storys am Tag raus: umgeschriebene „New York Times“-Artikel oder frei erfundene Geschichten. So verbreitete das Portal CelebritiesDeaths.com die Falschmeldung, dass US-Präsident Joe Biden verstorben sei.

Vor ein paar Jahren mussten Fake-Artikel noch von Hand geschrieben, Bilder mit Photoshop bearbeitet werden: In der mazedonischen Kleinstadt Veles entstanden Fake-News-Fabriken, wo Klickarbeiter für ein paar Euro Falschnachrichten in die Tasten hauten. Heute kann jeder mit frei zugänglichen Bild- und Textgeneratoren Fake News produzieren. Jeden Tag entstehen neue Content-Farmen, die das Netz mit computergenerierten Inhalten zuspammen.

Spam: Schon immer ein Problem im Netz

Generative KI hat die Schleusen der Information geöffnet: Amazon wird mit KI-generierter Schundliteratur geflutet, Nutzer werden mit KI-generierten Phishing-Mails bombardiert. Spam war schon immer ein Problem im Netz. Die erste ungefragte Massennachricht wurde 1976 verschickt, lange bevor das World Wide Web freigeschaltet wurde. Mithilfe von Algorithmen ist es gelungen, die rund 150 Milliarden Spam-Mails, die jeden Tag auf der Welt verschickt werden, einigermaßen zu filtern. Doch der KI-generierte Müll, der frei von jedwedem ökologischen Bewusstsein ins Netz gekippt wird, könnte die digitalen Klärwerke überfordern.

Man kann sich das World Wide Web als einen riesigen Ozean an Informationen vorstellen. Der gewöhnliche Nutzer taucht aber meist nicht in die Tiefe, sondern bewegt sich auf den Tankern großer Plattformen wie Google, dessen Tauchroboter, sogenannte Webcrawler, die Tiefen des Netzes durchwühlen und Webseiten nach Relevanz sortieren.

Von den schätzungsweise 1,1 Milliarden Webseiten, die es im Netz gibt, hat Google aber nur einen Bruchteil indexiert – der Rest lagert als inaktive Karteileichen auf den Tiefseeböden: alte MySpace-Profile, wo man noch die kecken Frisuren der Nuller Jahre trug, oder Homepages, die man in den späten 1990er Jahren mit animierten GIFs bastelte. Dieses sogenannte Darkweb (nicht zu verwechseln mit dem Darknet) ist quasi das No Man’s Land. Aber auch das, was Google auf den Seiten 2 ff. auf seiner Trefferliste anzeigt, wird von den Nutzern so gut wie nicht angeklickt.

Das Inselhopping, das einen in den Nuller-Jahren auf die verschiedensten Blogs führte, ist passé – Google hat in seinem rigorosen Kampf gegen Spam den Hyperlink ausgetrocknet. Die Bedeutung des PageRank-Algorithmus ist für die digitale Informationsordnung daher kaum zu überschätzen: Was der Algorithmus ausspuckt, hat Einfluss darauf, worüber berichtet oder geforscht wird. Doch je mehr Müll in die digitalen Weltmeere einfließt, desto schwieriger wird es, die relevanten Informationen aufzufischen.

Schon seit einiger Zeit beklagen Nutzer die nachlassende Qualität von Googles Suchmaschine. Die Ergebnisliste ist mit Anzeigen vollgepflastert. Wer nach Fernseher sucht, erhält Links zu Elektronikfachgeschäften, aber kaum Informationen über die zugrundliegende Technik. Zwar hat Google mittlerweile sein Sprachmodell Bard in seine Suche integriert. Trotzdem wird man den Verdacht nicht los, dass der Tech-Konzern die kommerzielle Suchmaschinenoptimierung zu weit getrieben hat.

Informationsströme kollabieren

Nutzer suchen längst nicht mehr nur in Google, sondern auf Tiktok oder Reddit. Während Google-Ingenieure verzweifelt an ihren Algorithmen schrauben, passiert in den Tiefen der Ozeane etwas, was die Statik der Informationsarchitektur ins Wanken bringen könnte: die Informationsströme kollabieren.

Seit dem Erfolg von ChatGPT sind zahlreiche Plattformen dazu übergegangen, ihre Seiten für Webcrawler zu sperren. Die Betreiber wollen nicht, dass sich Softwareschmieden kostenlos an ihren Texten bedienen und damit ihre KIs trainieren. X (vormals Twitter) hat ein Lese-Limit für Kurznachrichten eingeführt, Reddit seine Benutzerschnittstelle kostenpflichtig gemacht, der britische „Guardian“ hat den ChatGPT-Entwickler Open AI sogar ganz blockiert.

Das Versiegen der Quellen ist für Google aus zweierlei Gründen ein Problem: Zum einen braucht der Konzern Informationsschnipsel für das Feintuning seiner Suchergebnisse, das sogenannte Webscraping. Zum anderen benötigt Google riesige Textmengen, um seine KI zu trainieren. Fehlt es an einer breiten Datengrundlage, wächst die Gefahr, dass die KI halluziniert. Googles Sprachmodell Bard hat bereits Verschwörungstheorien verbreitet.

Digitalexperten sehen die Gefahr eines „KI-Kannibalismus“, wenn KI-Systeme mit KI-generierten Texten trainiert und das wiederkäuen, was andere Maschinen vorher ausgespuckt haben. Schon jetzt füllen Klickarbeiter auf der Amazon-Plattform „Mechanical Turk“, wo Wissenschaftler empirische Daten erheben, psychologische Fragebögen mit ChatGPT aus. Wenn derlei Junk Science unkontrolliert in das World Wide Web diffundiert und sich in den Schleppnetzen der Webcrawler verfängt, könnte das am Ende wieder im Futter von Maschinen landen. Die dann wieder ihren Schrott im Netz abladen. Regelrechte Müllstrudel könnten so im digitalen Ozean entstehen, die Googles Gatekeeperfunktion erodieren.

KI killt das alte Web

Der Journalist James Vincent hat in einem klugen Essay für „The Verge“ geschrieben, dass wir gerade die Geburtswehen eines neuen Informationskosmos erleben: „Die KI killt das alte Web, und das neue Web kämpft, geboren zu werden.“ Wie das neue Web aussehen wird, weiß niemand. Während die Krypto-Gemeinde das Web 3.0 auf eine dezentrale Blockchain setzen will, hat Facebook-Gründer Mark Zuckerberg das Metaverse als dreidimensionalen Internetnachfolger ausgerufen – wobei Suche im Raum komplett neu definiert werden müsste.

Bill Gates meint derweil, dass ein KI-gesteuerter persönlicher Assistent, der alles gelesen hat und Nutzer durch die Welt navigiert, zum Google- und Amazon Killer werden könnte. Aber bis es so weit ist, braucht man vermutlich erstmal einen Kompass für das alte Web.