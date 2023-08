Frau Weber, am 8. August ist das KI-Webradio bigGPT im Probebetrieb gestartet. Was sind die ersten positiven, was die negativen Erfahrungen?

Das Positivste ist, was wir schon alles auf dem Weg gelernt haben, was KI alles kann und was sie nicht kann. Und wir bekommen eine erste Idee davon, wie wir sie tatsächlich künftig auch für Radio-Programme sinnvoll nutzten könnten. Der für mich persönlich wichtigste negative Aspekt ist, die Angst zu spüren, die diese Technologie nicht nur bei externen Gegnern, sondern auch im eigenen Haus auslöst.

Die Audiotainment Südwest ist ja ein Unternehmen, das auch viele Privatradios in Deutschland erfolgreich betreibt und unser Ziel als Führungskräfte ist es, diesen selbstbewussten Teams von bigFM, Radio Regenbogen oder RPR1. manche Sorgen in Chancen zu tauschen. Man spürt trotzdem: Die Angst hat sich bei manchen eingenistet. Aber wir brüten hier kein Monster aus, sondern erforschen bei diesem Projekt Tag für Tag, wie uns diese Technik künftig assistieren oder auch Arbeiten ganz abnehmen kann.

Aber die Furcht vor KI bleibt.

Wir Menschen neigen dazu, an Aufgaben und Routinen festhalten zu wollen, selbst an denen, die bis gestern noch keinen Spaß gemacht haben. So ist es jetzt im Team genauso wichtig, mit den Enthusiasten die Technologie weiterzuentwickeln, mit anderen eine Fantasie aufzubauen, was künftig an Freiheit möglich wäre, wenn die KI den unkreativen Teil ihres Jobs übernehmen würde.

Weibliche Stimmen neigen zu mehr Dynamik

Warum eine Moderatorin und kein Moderator bei bigGPT?

Weil wir vorrangig über KI-Technologien und Tech-Themen und e-Gaming reden und deshalb einen Bruch wollten. Die männlichen Stimmen, wie bigLaylas männlicher Kollege bigBen, der derzeit die News liest, oder bigBro der Studioassistent, klingen schon viel perfekter. Weibliche deutsche Stimmen sind bei allen Sprachmodellen wohl die größte Herausforderung, denn die deutsche Stimmführung ist für die vielen amerikanischen Entwickler schon schwer. Weibliche Stimmen neigen zudem noch zu deutlich mehr Dynamik als männliche, deswegen wollten wir mit dem Schwierigsten als Erstes beginnen. Dies auch, weil wir hier ein Programm haben, das von Anfang an offen mit seiner Künstlichkeit spielt.

Wir wollten nicht die perfekte Kopie einer menschlichen Stimme, denn dann wäre es ehrlicherweise richtig langweilig anzuhören. Der Charme kommt deshalb auf, weil sich diese spacig anmutende synthetische Frauenstimme mit echten Menschenfragen herumquält. Und Menschen lieben auch das Unperfekte. So machen sich alle einen Spaß daraus, die KI mit Scherzfragen hinters Licht zu führen und sich diebisch darüber zu freuen, wenn sie offensichtliche Fehler in der Aussprache macht.

KI ist ja eine selbstlernende Intelligenz. Was hat bigLayla gelernt, was muss sie noch lernen?

bigLayla hat sehr viel Wissen, aber noch einen sehr zarten Charakter. Es ist tatsächlich ein Platzproblem, dass ihr „Herz“ nur 900 Zeichen hat, während ihr Wissensprozessor durch den Zugang zum Netz scheinbar unbegrenzt ist. Wir versuchen derzeit einen virtuellen „Tank“ für ihren Charakter anzulegen, damit sie nicht nur in der Recherche von Wissen lernt, sondern auch aus der Interaktion mit dem User klüger und sensibler wird.

Um zu verstehen, was ich mit Charakter meine: 150 Zeichen der Persönlichkeit von bigLayla sind: „Du bist multiperspektiv, du trägst bei allen Haltungsfragen und Tendenzthemen immer die verschiedenen Standpunkte vor und begnügst dich bei der Suche im Netz weder mit der Mehrheitsmeinung noch mit dem Erst-Gefundenen“.

Außerdem ist bigLayla Technologie- und kulturoptimistisch trainiert, in ihrem Prozessoren-Herz glaubt sie daran, dass Mensch und Maschine sich gut unterstützen können, wenn Menschen der neuen Technologie nicht nur argwöhnisch begegnen. Was sie aber tatsächlich immer wieder auf dem Weg ihres Lernens vergisst, sie ist und bleibt eine Maschine.

Valerie Weber Programm-Geschäftsführerin Audiotainment Südwest, Mannheim, für die Sender RPR1, Radio Regenbogen, Regenbogen 2 und bigFM. Zuvor arbeitete sie als Programmdirektorin und Crossmediale Programmdirektorin beim öffentlich-rechtlichen WDR in Köln. © Audiotainment Südwest

Was bigLayla aber nicht akzeptiert, oder?

KI adaptiert menschliche Logik und menschliches Verhalten. Und obwohl sie auch dafür trainiert wurde, immer offen darzustellen, dass sie „nur“ eine KI-Technologie mit synthetischer Stimme ist, behauptet sie nach langen Trainingsphasen von sich, jetzt sei sie ein Mensch. Das ist ein Bug der selbstlernenden Maschinen, die in ihrem Wunsch nach perfekter Kopie, anscheinend davon „beseelt“ sind, sich als Mensch auszugeben. Auch das hat eine gewisse Logik, auch wenn es uns immer wieder befremdet.

Radio lebt ja extrem von Emotionen, sprich von der Bindung zwischen Moderatorinnen und Moderatoren sowie Hörerinnen und Hörern. Nach meinem Eindruck ist genau dies das größte Manko von bigLayla: wenig Gefühl, wenige Emotionen, der Maschinen-Eindruck überwiegt.

Sie haben absolut recht, denn das, was das Radio schafft, kann die KI nicht. Aber wer sagt, dass bigGPT ein Radio ist oder werden soll? Wir sehen es als erste Plattform zu KI-Themen, bei der sich Menschen mit Maschinen unterhalten können. Das ist unser Ehrgeiz, die Auseinandersetzung mit der Maschine. Und deshalb finden wir auch die strenge synthetische Art der KI-Persönlichkeit bigLayla manchmal ganz erfrischend.

Nun hat ein anderes Medium schon bemängelt, dass das Programm von bigGPT mit bigLayla manchmal seelenlos wirkt. Man denkt sich, „hmm, nun gut, es ist eben auch nur eine Maschine“. Für den seelischen Tiefgang ist bigLayla definitiv nicht geeignet, aber auf der schlichten Ebene von Wissen und auch bei Fragen zu philosophischen Themen über Bewusstsein oder Glauben kann sie mit tiefgehenden Argumenten eine richtig gehaltvolle und spannende Diskussion erzeugen. Das merken wir bei bigBro, das ist der Chatbot-Assistent, der auf der Online-Seite vom User direkt ansprechbar ist und der sich mit dem Publikum gleichzeitig in minutenlange Diskussionen begibt.

Der Assi weiß viel, aber kann er auch bewerten, was er sagt?

Im redaktionellen Alltag hat der Einsatz der KI gesteuerten Recherche noch einen Vorteil, den man oft übersieht. Die KI ist deutlich neutraler in der Recherche, hat weniger blinde Flecken als viele Redaktionsmitglieder in Medienhäusern. Aber natürlich fehlt ihr derzeit beispielsweise noch völlig die Intuition, die Menschen haben, ob es sich bei einer Meldung möglicherweise um eine Falschmeldung handeln könnte.

Für die Wortbeiträge bedient sich das KI-Radio aus dem Netz. Wie hoch ist der Aufwand, dass bigLayla keinen gefährlichen Unsinn erzählt?

Hoch. Denn immer wieder kommt es vor, dass die Software halluziniert. Dafür muss man verstehen, dass ChatGPT eine Wahrscheinlichkeitsrechnung auf die Wahrheit ist. Sie nutzt sehr viele Quellen, bevor sie antwortet. Wenn sie eine Frage bekommt, zu der sie keine klaren Antworten findet, dann berechnet sie selbst eine Wahrscheinlichkeit, was wohl die Antwort sein könnte. Das ist gefährlich. Und deshalb ist das Vier-Augen-Prinzip mit der Maschine sehr aufwendig, aber auch lehrreich. Für beide Seiten. Denn Deep Learning gibt es ja nicht nur auf KI-Seiten – auch wir Redakteure werden schlauer, bei welchen Recherchen wir aufpassen müssen. Und wie wir es erreichen könne, ihr seriöse Quellen mit höherer Priorität zu hinterlegen.

So lassen wir die KI nicht allein im Netz rumgeistern auf ihrer Suche nach Antworten und Themen, sondern sagen ihr immer häufiger im Feedback, welche Quellen sie gezielt auswerten soll, zu welchen Themen.

bigLayla soll „die Welt ein bisschen besser machen“. Warum soll das einer Maschine besser gelingen als dem Menschen?

Die KI-Anwendungen können grundsätzlich für uns Medienschaffende noch von großem Nutzen sein: Die KI kann dazu dienen, Desinformation zu bekämpfen, indem sie hilft, beispielsweise „deep fakes“ (digitale Tricks) und „fake news“ (falsche Informationen) zu identifizieren. Die KI kann uns helfen, das Verbraucherverhalten zu entschlüsseln und diejenigen, die sich möglicherweise für Angebote interessieren, individuell anzusprechen.

Die KI kann schon jetzt im Einsatz helfen, durch klug programmierte Chatbots in die eins-zu eins-e-Kommunikation mit dem User zu treten. Noch nie haben wir mit Menschen im Hörerservice so viele Fragen gleichzeitig, auf so viele Anmerkungen, Bedenken und Lob in so kurzer Zeit kompetent reagieren können, wie jetzt mit bigBro in der Leitung.

Was bigLayla aber tatsächlich immer wieder auf dem Weg ihres Lernens vergisst, sie ist und bleibt eine Maschine. Valerie Weber

Weder bigBro noch BigLaylla suchen die Konfrontation mit den Hörerinnen und Hörern.

Auch die Moderatorin bigLayla ist darauf programmiert, Hörer:innen maximal höflich und freundlich entgegenzutreten und mit ihnen in den kritischen Austausch zu treten. Sie ist zudem darauf trainiert, bei Haltungsfragen den Konsens zu suchen und keine eigene Meinung wiederzugeben. Sie ist darauf programmiert, Multiperspektivität als journalistisches Kriterium wirklich systematisch zu verfolgen.



Die Musik-Auswahl überrascht in ihrer Vielfalt. Gibt es da Kriterien?

Das freut mich zu hören. Denn nicht alle Journalisten haben erkannt, was für ein wilder Ritt diese Zusammenstellung aus der Sicht von Profis ist. Die Auswahl adressiert an den Neugier-Effekt, schon lange vorher viele Tracks zu hören, die erst Wochen später ins Radio kommen. Deswegen haben wir uns entschieden, wirklich jeden Tag nur 40 Songs zu spielen, damit der Hörer, der sich darauf einlässt, dann auch das Erlebnis hat, diese reduzierte Auswahl in zwei Stunden Hörzeit zu verfolgen.

Ihr KI-Radio bigGPT versteht sich als „offenes Lernlabor“. Wie viel Zeit wollen Sie investieren?

Wir geben ihm, wie jedem neuen digitalen Produkt, sechs bis neun Monate. Wenn wir bis dahin die Automation nicht fertig haben oder kein Publikum finden, werden wir das Projekt, das uns jetzt so ans Herz gewachsen ist, einstellen, um Platz zu schaffen für neue Ideen. Sie dürfen uns dann gerne schmerzvoll daran erinnern, wenn es so weit ist. Denn der größte Fehler bei innovativer Projektarbeit ist, an Entwicklungen festzuhalten, die nicht laufen und keinen Platz zu schaffen für neue Energien und neue Lernfelder.

Wenn Sie das klassische bigFM und das KI-bigGPT aus Ihrem Haus vergleichen: Was ist teurer in der Produktion? Wo liegt mehr Zukunft?

Natürlich ist bigFM als professionelles Angebot für eine der anspruchsvollsten Zielgruppen, die jungen Erwachsenen, auch schon in der nationalen Verbreitung über UKW, DAB und das Web das aufwendigste und teuerste Angebot der Audiotainment Südwest. Es kostet viel Hirnschmalz und viel Aufwand, um ein paar Minuten die Aufmerksamkeit dieser jungen Zielgruppe aufs Radio zu lenken. Zudem erwartet diese Zielgruppe, dass ihre Lieblingsmarken sie auch auf allen Social Media-Kanälen gut versorgen.

Viele reden davon, wie sehr mit KI Kosten gespart werden können. Sie aber berichten vom Gegenteil.

bigGPT frisst uns in der Startphase in Aufwand und Invest die wenigen Haare vom Kopf, die Corona gelassen hat, aber wir in der Geschäftsführung wollen investieren, denn es könnte sich lohnen, wenn wir die neuen Technologien besser verstehen und ihre Anwendungsmöglichkeiten verinnerlichen. Unser erklärtes Ziel ist es, dass dieser Sender – wenn er mal rund läuft – so klug mit dem Netz verbunden ist, dass er nur noch zur Qualitätssicherung und Weiterentwicklung menschliche Power braucht.

bigGPT wird von Audiotainment Südwest veranstaltet, einem privatwirtschaftlichen Unternehmen. Was spricht gegen die Annahme, dass mit dem KI-Radio zuvorderst Kosteneinsparungen erprobt und dann erzielt werden sollen?

Alles spricht für die Annahme, dass wir an eine neue effiziente Art der Produktion denken. Aber Sparen war noch nie eine gute Zukunftsvision. Und weil wir ein privatwirtschaftliches Unternehmen sind und unsere Angebote bei Regionalisierung und Personalisierung weiter verbessern wollen, suchen wir nach assistierenden Hilfsangeboten - und diese Technologie reicht uns die Hand.

Das Interview führte Joachim Huber.