Wissen : Sprich zu mir!

Ein neues „Language Archive“ sammelt alle Sprachen

von
Dokumentiert. In Namibia schauen sich Mitglieder der „Akhoe Hai//om“ ihr eigenes Sprachvideo an. Foto: promo/Thomas Widlok
Dokumentiert. In Namibia schauen sich Mitglieder der „Akhoe Hai//om“ ihr eigenes Sprachvideo an. Foto: promo/Thomas Widlok

Exakt 6632 Sprachen, so berichtet der Kölner Linguist Nikolaus Himmelmann, werden auf der Welt gesprochen. Doch lediglich 389 von ihnen weisen mehr als eine Million Sprecher auf, das sind sechs Prozent aller Sprachen. Die übrigen 94 Prozent „kleiner“ Sprachen können umgekehrt nur auf 360 Millionen Sprecher gleich sechs Prozent aller Erdbewohner zählen, während die „großen“ Sprachen mit 5,6 Milliarden Sprechern 94 Prozent der Weltbevölkerung auf sich vereinen.

Im statistischen Mittel stirbt jede Woche eine Sprache aus, so die Schätzung der Linguisten, aber genau lässt sich das naturgemäß nicht ermitteln. Deutlich ist allein die wissenschaftliche Verpflichtung, kleine und – was meist dasselbe ist – bedrohte Sprachen aufzuzeichnen und zu bewahren. Dass die Internetseite des „Language Archive“, das als Gemeinschaftsvorhaben der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW), ihrer Schwesterinstitution KNAW aus den Niederlanden sowie des Max-Planck-Instituts, die jetzt offiziell inauguriert wurde, in englischer Sprache daherkommt, belegt ungewollt den Druck, der von dieser Weltsprache auf alle weniger globalen Sprachen ausgeübt wird. Werden die Sprachen der Welt in englischer Transkription bewahrt, zugänglich allein dem fluent speaker?

Diese durchaus naheliegende Ebene der Selbstreflexion war den Referenten der Auftaktveranstaltung im Einsteinsaal der BBAW fremd, und so wimmelten die Vorträge von termini technici, nein, beileibe nicht in der einstigen lingua franca des Lateinischen, sondern in Englisch. „The Language Archive“ (TLA), so sein Leiter und energischer Motor Wolfgang Klein, Direktor am Max-Planck-Institut für Psycholinguistik, soll die bereits vorhandenen Datenbestände zusammenführen und „der wissenschaftlichen Öffentlichkeit zur Verfügung stellen“.

Bislang sind 80 Terabyte Speicherplatz mit Daten aus 200 Sprachen gefüllt, im Mittel 80 bis 100 Stunden Audio- und Videoaufnahmen je Sprache. Um eine Stunde davon in eine gängige Wissenschaftssprache zu übersetzen, bräuchte man noch einmal 35 Stunden, um sie voll zu erschließen, gar 100 Stunden. Nur rund 100 Sprachen weltweit sind „gut beschrieben“, wofür ein Maßstab von „mindestens drei Wörterbüchern und drei Grammatiken“ anzusetzen sei. Die von Peter Wittenberg ersonnenen tools oder Werkzeuge erlauben leichtes Hochladen, stellen Metadaten bereit und erlauben die Transkription der Dateien, um Annotationen beispielsweise zur grammatikalischen Struktur vorzunehmen.

Die Schwierigkeiten liegen im Gegenstandsbereich der Linguistik begründet. Nikolaus Himmelmann stellte die „Immaterialität sprachlicher Zeichen“, die eine quantifizierende Empirie ausschließt, dem von jedem Sprecher nachzuvollziehenden Umstand gegenüber, dass „sprachliche Strukturen selbstevident“ sind und Empirie damit „unproblematisch“. Jedoch „reicht die physische Manifestation sprachlicher Zeichen nicht hin zur Deskription von Sprache“: Jede Aussprache klingt anders und ergibt eine unterschiedliche Darstellung nach Parametern wie etwa dem Frequenzverlauf. Zugleich gilt, talk is cheap: Sprachliche Äußerungen gibt es in unbegrenzter Fülle. Auch zum Speichern im TLA. „Die Datenproblematik“, so Himmelmann, „ist in der Kernlinguistik angekommen“.

Als handfeste Empirie bleibt hinzuzufügen, dass das TLA über sieben Stellen verfügt, auf fünf Jahre hinaus von seinen drei Trägern finanziert ist und laut Wolfgang Klein „sehr, sehr optimistisch“ in die Zukunft blicken kann. So schloss denn auch Wilhelm Krull, Generalsekretär der Volkswagen-Stiftung, seinen Vortrag ganz altertümlich mit dem Wunsch ad multos annos. Dies aus einer bereits toten, aber doch sehr lebendigen Sprache. Bernhard Schulz

1 Kommentar

Neuester Kommentar
      Kommentar schreiben