Herr Hornschuh, haben Sie als Komponist Angst, in zehn Jahren Ihren Job zu verlieren und durch generative KI ersetzt zu werden?

Interessanterweise habe ich persönlich überhaupt keine Angst. Das hat aber mit dem zu tun, was ich tue. Wenn ich für Hörspiele arbeite, für Filme komponiere, dann sind es meistens Projekte, bei denen ein Konzept und eine konkrete Haltung zum Gegenstand von entscheidender Bedeutung ist. Wenn es darum ginge, einfach irgendwas zu machen, was nach Hans Zimmer oder John Williams klingt, dann müsste ich mir Sorgen machen.

Aber am Ende entscheidet doch das Publikum?

Ich unterscheide grundsätzlich zwischen Produktion und Rezeption. Die beiden Ebenen wissen sehr wenig voneinander. Aber das ist eine Binsenweisheit. Natürlich entscheidet das Publikum darüber, was ihm gefällt; das ist sein gutes Recht. Das kann man weder beeinflussen noch regulieren.

Gibt es Bereiche, in denen die Entwicklungen besonders schwerwiegend sind?

Unter Metalbands gibt es im Moment so einen Scherz: Wer soll eigentlich in Zukunft noch Metal-Cover machen? Da gibt es ja sehr generische Fantasy-Grafiken mit Drachen, roten Flammen und so, das macht man heute auf Knopfdruck mit KI. Genau dieses Stichwort „generisch“, also wenn etwas komplett nach Rezept gemacht wird, ist entscheidend. Das fängt schon da an, wo man auf dem Volksfest oder in der Kneipe einfach Hintergrundmusik braucht, die Stille vermeiden soll.

Zur Person Matthias Hornschuh, 1968 in Solingen geboren, ist Komponist für Film, Hörspiel und Theater. Als Sprecher der Initiative Urheberrecht setzt er sich für die Interessen von 140.000 Urheber:innen in Deutschland ein. Im April richtete sich das Bündnis aus 40 Gewerkschaften und Verbänden an die EU, um für wirksame Regulierungsmaßnahmen von generativer KI einzutreten. Mehr unter hornschuh-musik.de

Sind von den Entwicklungen also nur massentaugliche Produkte betroffen?

Nein. Aber auch an dieser niederschwelligen Stelle wird im Moment natürlich Geld verdient. Und dieses Geld fließt in ein Gesamtsystem, das tragfähig wird, weil an einer Stelle Exzellenz stattfindet, an einer anderen Stelle Massenmarkt. Erst beides gemeinsam stellt Tragfähigkeit her. Wir machen uns schon Sorgen, wenn diese Massenmärkte gefährdet sind oder mittelfristig wegbrechen, weil dann die wirtschaftliche Basis insgesamt angegriffen wird.

Was sollte die Bundesregierung tun?

Deutschland alleine wird nicht mehr viel zu melden haben. Wir kriegen KI ganz bestimmt nicht auf nationaler Ebene gegriffen, allenfalls auf EU-Ebene.

Wie müsste die EU tätig werden?

Wenn man auf die digitalen Regulierungsgroßvorhaben der Europäischen Union guckt aus den letzten zehn, 15 Jahren, dann wird man sich fragen müssen, ob die nicht alle neu aufgemacht werden müssen.

Die Urheberrechtsreform ist noch ziemlich jung, muss das Gesetz schon wieder geändert werden?

Natürlich müssen wir ans Urheberrecht ran. Ganz offensichtlich wird hier schon wieder in Kauf genommen, dass diejenigen, die Inhalte schaffen, zu Schaden kommen. Das kennen wir aus der MP3-und der Piraterie-Debatte. Immer wieder heißt es: „Na ja, Ihr werdet nicht mehr gebraucht.“ Und das stimmt eben nicht, wir werden zu 100 Prozent gebraucht. Ohne uns kann KI gar nicht funktionieren.

In der Urheberrechtsrichtlinie der EU und in Deutschland gibt es eine Regelung, die kommerzielles Data Mining erlaubt.

Im Moment steht die Überlegung im Raum: Ist das überhaupt Data Mining, wenn Daten und Werke für das Training von AI Foundation Models verwendet werden? Es gibt gute Gründe anzunehmen, dass das gar nicht derselbe Tatbestand ist und es sich um eine neue Nutzungsart handelt. Insofern kann es sein, dass wir dazu noch gar kein Recht haben.

Der Data Mining-Paragraf sieht aber auch einen Nutzungsvorbehalt vor.

Es gibt ein Recht auf eine Vorbehaltserklärung und diese muss maschinenlesbar erklärt werden. Doch niemand weiß, wo eigentlich Maschinenlesbarkeit beginnt. Also schreiben wir jetzt alle irgendwo auf unsere Webseiten oder in unsere Streams: „Ihr dürft das nicht scrapen“. Ob sich jemand darum kümmert, ist eine andere Frage. Und ob das gerichtsfest sein wird, wird man in 15 Jahren wissen, wenn irgendjemand eine Klage bis zum BGH oder bis zum EuGH durchgezogen hat.

Das heißt, am Ende sind trotzdem die Urheber:innen in der Bringschuld?

Das sind wir immer, wir werden immer nachgelagert betrachtet. Das heißt auch, dass wir darauf pochen müssen, dass Rechte, die uns mitgegeben werden, auch durchsetzbar sind.

Es wird berichtet, dass ein Großteil dessen, was im Internet jemals zur Verfügung stand, schon in diesen Systemen drinsteckt.

Wir müssen davon ausgehen, dass eigentlich mehr oder weniger alles, was digital verfügbar ist, schon um Training herangezogen wurde. Nicht unbedingt in einer einzelnen Datenbank, doch verteilt über die Verschiedenen.

Wie kommen die Unternehmen damit durch?

Es wird ja Schindluder getrieben mit der aktuellen Regulierung. Auf mehreren Ebenen gibt es die Ausnutzung geltenden Rechts. Erstens hat das Scrapen, also die Zusammenstellung der Daten-Korpora fürs Training begonnen, lange bevor wir überhaupt eine rechtliche Grundlage bekommen haben. Um 2010 herum haben die Unternehmen angefangen, die Datenbestände aufzufüllen. Aber erst 2019 haben wir die DSM-Richtlinie auf europäischer Ebene bekommen. Seither gibt es den Text- und Data-Mining-Paragrafen. Selbst wenn der greifen würde, wäre er erst neun Jahre später ins Recht gekommen. Wenn ein Anbieter illegal Daten gescraped haben sollte, sie dann vorhält und ein anderer auf diesen Datenbestand zugreift, dann ist das nicht mehr illegal. Es ist nur eine offensichtliche Ausnutzung.

In der Position des Europäischen Parlaments zum AI Act gibt es jetzt zumindest eine Transparenzpflicht für ChatGPT und Co. Inwiefern profitieren Künstlerinnen davon?

Ich glaube, dass wir das Recht haben sollten, zu erfahren: „Sind wir dort verwendet worden?“. Insofern profitieren wir zunächst einfach davon, dass es ein Bewusstsein gibt und dass es eine Verpflichtung gibt, damit umzugehen.

Profitieren auch die Hersteller von den KI-Systemen?

Ein Aspekt, den ich noch überhaupt nirgendwo diskutiert gesehen habe, ist, dass die KI-Betreiber selbst darauf angewiesen sind, immer neues Material angeliefert zu kriegen, mit dem sie trainieren können. Fatal wäre, wenn das Training irgendwann mittelfristig darauf aufsetzt, auf KI generierten Inhalten zu trainieren. Dann entsteht etwas, was als degenerative KI bezeichnet wird. Das heißt, das System erleidet einen Modellkollaps. Und deswegen glaube ich, dass die KI-Betreiber ein Eigeninteresse an einer maschinenlesbaren Transparenz-Kennzeichnung haben sollten.

Wie könnte eine solche Kennzeichnung aussehen?

Grundsätzlich ist es so, dass es mindestens zwei verschiedene Modelle gibt, über die gesprochen wird. Das eine ist, dass man wirklich einen Metadatensatz an die Datei anhängt. Das andere ist, dass man in den Inhalt der Datei etwas rein codiert. Es ist jetzt auch schon so, dass es das gibt und dass das auch grundsätzlich funktioniert, sodass zum Beispiel eine bestimmte Art von Mustererkennung verunmöglicht werden kann.

Taugt die Idee von einem Wasserzeichen oder Metadatensatz etwas vor dem Hintergrund, dass sich Leute im Netz alles Mögliche einfallen lassen werden, um so etwas zu umgehen?

Das ist ja nichts Neues. Wir haben im Urheberrecht seit Dekaden das Verbot, Kopierschutzmaßnahmen zu umgehen. Und natürlich hat man das da reingeschrieben im Wissen darum, dass es möglich ist, das zu umgehen. Aber erst, indem wir Verbote formulieren, machen wir eine Sanktionierung möglich.

Sehen Sie auch Probleme beim AI Act?

Ich habe die grundsätzliche Kritik, dass immer wieder bei Digital-Regulierungspaketen größter Größenordnung gesagt wird: „Aber das Urheberrecht nehmen wir da nicht mit rein“. Da sind eine ganze Reihe von Irrtümern drin verpackt. Es ist einfach so, dass die Kultur- und Kreativwirtschaft auf europäischer Ebene zu den drei größten Teil-Branchen gehört und das wesentliche Marktordnungsrecht in dieser Branche das Urheberrecht ist. Schließlich ist alles, was überhaupt verkauft, gesendet oder gestreamt werden kann, letzten Endes urheberrechtlich geschützt. Da dann dieses Recht immer herauszunehmen, hat geradezu etwas Duckmäuserisches.

Was sehen Sie als besonders schwerwiegend an?

Wenn die Stimme einer prominenten Darstellerin wie Emma Watson, die sich stark politisch engagiert, hergenommen wird, um Hitlers „Mein Kampf“ vorlesen zu lassen und sie kann nichts dagegen tun, wird man ganz schnell zu dem Ergebnis kommen, dass an der Stelle die Identität von Menschen infrage gestellt wird, also wirklich geschädigt wird. Das ist im Urheberrecht, konkret im Leistungsschutzrecht gefasst. Das ist aber auch in Deutschland, zum Beispiel im Recht auf informationelle Selbstbestimmung, gefasst.

Wer trägt die Verantwortung in einem solchen Fall?

Wenn so was passiert wie mit Emma Watsons Stimme, müsste man im ersten Schritt den Voice Cloner, den Anbieter des Services zu greifen kriegen. Und die Frage, die wir ja seit ganz langer Zeit immer wieder verhandeln müssen, ist: Was passiert denn eigentlich mit einer Kette von Verantwortungen, wenn immer Abrisse sind beim Wissen darüber, wer was getan hat? Das ist ja das, was wir in den letzten 25 Jahren immer erlebt haben – dass Anbieter wie YouTube sagen: „Uns gehören nur die Festplatten. Was die Leute damit machen, das wissen wir jetzt auch nicht, da können wir auch nichts für.“

Wie würden Sie das Problem angehen?

Der sogenannte ABC-Approach ist da ganz interessant. Der besagt, dass in der Kette von Verantwortungen immer da, wo ein Abriss ist, derjenige an der Stelle, wo der Abriss stattfindet, haften muss. Das heißt, YouTube muss wissen, wer was hochlädt. Wenn sie es nicht wissen, haften sie selber. Das wäre ein Modell, mit dem wir zukünftig wirklich nachhaltig arbeiten könnten.

Nicht nur die Plattformen, auch die KI-Modelle sind in den Händen weniger sehr mächtiger Unternehmen. Welche Probleme macht das für die Regulation?

Zunächst mal ist das ein Anlass für Regulierung. Eines der zentralen Argumente für Marktregulierung ist, wenn der Markt monopolisiert wird. Und wir haben genau das hier prototypisch vorliegen. Wenn nämlich der Konzern Alphabet sowohl über die Foundation Models verfügt als auch über die generativen KI-Modelle als auch über die Vertriebsstrukturen als auch über die Rechenzentren, dann stellt sich die Frage, wie wir als Öffentlichkeit damit eigentlich umgehen können, wenn derjenige, der die öffentlichen Räume vorhält, gleichzeitig die Inhalte schafft. Eine Sache, die da im Raum steht, ist die Frage nach Entflechtung.

Was bedeutet das für Urheber:innen?

Bleiben wir mal bei Google. Der Konzern kann in Zukunft die eigenen Plattformen nach und nach mit generativ hergestellten Inhalten fluten und damit das menschengemachte Repertoire marginalisieren. Früher oder später wird eine Situation da sein, in der Google dann sagen kann: „Warum sollen wir euch noch lizenzieren? Wir haben genug eigene Inhalte“ und dann haben wir wirklich ein Problem.