Zentrum für digitale Lexikographie : Grapefruit statt Pampelmuse

Lange Zeit steckte die Forschung am deutschen Wortschatz in der Krise. Jetzt gibt es ein neues Zentrum in Berlin.

„Vorzüglich“. Dieses Wort verliert immer mehr an Popularität, haben die Forscher herausgefunden. Andere Begriffe wie „Hetzjagd“ haben plötzlich in anderen Kontexten Konjunktur.
„Vorzüglich“. Dieses Wort verliert immer mehr an Popularität, haben die Forscher herausgefunden. Andere Begriffe wie „Hetzjagd“...Foto: imago/Panthermedia/xmonticellox


Seit wann sagen die Deutschen lieber Grapefruit statt Pampelmuse? Was war nochmal die Bedeutung des Wortes „Fronvogt“? Und wann begann die steile Karriere des Verbs „liken“? Das sind nur einige der Fragen, die das neugegründete Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) künftig beantworten kann. Dank der Fördersumme von zwei Millionen Euro jährlich, die das Bundesministerium für Bildung und Forschung ab 2019 über einen Zeitraum von maximal acht Jahren bewilligt hat, wird die Forschung am deutschen Wortschatz damit endlich wieder auf eine solide Basis gestellt.
Vorausgegangen sind Jahre des Bangens. Eine ernsthafte „Krise der Lexikographie“ habe es um 2013 gegeben, sagt Alexander Geyken, Arbeitsstellenleiter des Digitalen Wörterbuchs der deutschen Sprache (DWDS) an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW). Alle maßgeblichen Wörterbuchvorhaben waren stark reduziert oder ganz beendet worden. Neue nicht in Sicht. Dabei verändert sich das Deutsche, das als eine der wortreichsten Sprachen der Welt gilt, laufend. Die dazugehörige Wissenschaft blickt auf eine stolze Tradition zurück: Die lexikographische Erfassung hat im 19. Jahrhundert schon die Brüder Grimm beschäftigt; sie begründeten das „Deutsche Wörterbuch“, das bei der Fertigstellung 1961 32 Bände umfasste. In der DDR arbeitete man seit 1952 an einem „Wörterbuch der deutschen Gegenwartssprache“. In der BRD erschien ab den 1970ern im Dudenverlag das mehrbändige „Große Wörterbuch der deutschen Sprache“. Doch zuletzt war das alles schlicht nicht mehr finanzierbar.

Im Zuge des digitalen Wandels hatten sich teure Wörterbücher überlebt

Dazu kam der digitale Wandel. Teure gedruckte Wörterbücher hatten sich überlebt; die kostenlose Verfügbarkeit über das Internet erschien weitaus zeitgemäßer. So entstand 2007 an der BBAW das „Digitale Wörterbuch der deutschen Sprache“ als Akademieprojekt mit wechselnder Drittmittelfinanzierung. 2012 ging die dazugehörige Website www.dwds.de online. Die Aufbauarbeit eines digitalen lexikalischen Informationssystems gelang, weil man auf die Einträge der alten Wörterbücher zurückgreifen und diese in die neue Datenbank einpflegen konnte. „Vor allem das DDR-Wörterbuch war sehr hilfreich“, sagt Geyken. Ohne diese Vorarbeiten „hätten wir buchstäblich bei Null anfangen müssen.“
Seitdem kann man beim DWDS besichtigen, wie vielfältig die moderne Lexikographie ist. Nicht nur Schreibweise, Aussprache, Bedeutungen, Herkunft, grammatische Eigenschaften oder regionale Varietäten werden erklärt, sondern auch statistische Tools angeboten. So entsteht durch einen Klick ein übersichtliches Kurvendiagramm, das das Aufkommen und Verschwinden einzelner Wörter zeigt. „Vorzüglich“ befindet sich beispielsweise eindeutig auf dem absteigenden Ast, während der „Populist“ seit 2012 im Sprachgebrauch massiv zugenommen hat. Die Grapefruit überrundete die Pampelmuse Anfang der 1990er Jahre, „liken“ wurde ab 2008 schlagartig beliebt.
Schon lange war klar, dass das DWDS mit seinen zehn Mitarbeitern für die Mammutaufgabe, den Wandlungsprozess der deutschen Gegenwartssprache des 20. und 21. Jahrhunderts abzubilden, viel zu klein aufgestellt ist. Denn das Deutsche ist eine Sprache mit schier unendlichem Wortschatz. Zwar führt der Rechtschreibduden nur 140.000 Wörter auf, doch das ist nur ein kleiner Ausschnitt. Rund 20 Millionen verschiedene Wörter lassen sich in unterschiedlichsten Textquellen nachweisen. Geyken erklärt, wie diese Zahl zustande kommt: „Sprache, insbesondere auch der deutsche Wortschatz, verläuft nach der sogenannten Zipf’schen Verteilung“ – eine steil aufragende Spitze, die zu einem endlos langen Rattenschwanz abfällt. Der Großteil aller Wörter kommt in den Textsammlungen des DWDS weniger als dreimal vor. „Das hat mit der morphologischen Besonderheit des Deutschen zu tun.“ Fast beliebig lassen sich Komposita, zusammengesetzte Wörter, bilden. Die wenigsten setzen sich langfristig durch. Gegenbeispiel „Mietpreisbremse“: Um 2010 aus drei bekannten Wortzutaten neu zusammengerührt, seitdem in aller Munde.

Die Textsammlung soll deutlich ausgebaut werden

Es ist unter anderem BBAW-Präsident Martin Grötschel, einem bekennenden Digital-Humanities-Verfechter, zu verdanken, dass das DWDS-Team nach Jahren unter recht bescheidenen Bedingungen nun erstmals langfristiger planen und forschen kann. Grötschel hatte im Sommer 2018 betont, einzelne Akademieprojekte besser absichern und teilweise zum Prinzip dauerhafter Forschungsinstitute zurückkehren zu wollen.
Wie das funktionieren könnte, wird nun anhand des digitalen Wörterbuchs deutlich: Für die kommenden fünf (plus maximal weiteren drei) Jahre ermöglichen die Mittel aus dem Bundeshaushalt den Aufbau des Zentrums für digitale Lexikographie. Das ZDL knüpft an die Arbeit des DWDS inhaltlich und personell an, kann nun aber 15 neue Stellen in Berlin schaffen. Getragen wird das Zentrum zunächst von der BBAW sowie drei weiteren Wissenschaftsakademien in Göttingen, Mainz und Leipzig. Bis 2027 soll dann die Verstetigung gelungen sein. Dafür muss ein institutioneller Rahmen geschaffen werden, der das ZDL langfristig unabhängig macht.
Ob das gelingt, hängt auch mit der Evaluierung zusammen. Einige Meilensteine müssen die Wissenschaftler in den kommenden Jahren erreichen. Unter anderem soll die Textsammlung deutlich ausgebaut werden. Bisher stützt sich die lexikographische Arbeit des DWDS auf 15 Millionen Zeitungsartikel und ebenso viele Onlinetexte. Das allein ergibt noch kein vollständiges Bild der deutschen Sprache. „Wir wollen auch Ratgeberliteratur, Belletristik und Sachbücher auswerten können“, erklärt Geyken. Dazu sind zähe Rechteverhandlungen mit vielen Verlagen nötig. „Das ist eine der Aufgabe, die wir uns gesetzt haben.“
Das andere große Ziel heißt: die Inhalte ausbauen und die Reichweite erhöhen. Die bereits bestehenden 170.000 Wörterbucheinträge sind nicht alle auf dem neusten Stand. Weitere 30.000 Wörter stehen auf einer Kandidatenliste, das heißt, sie sollen ebenfalls schnellstmöglich eingearbeitet werden. Für die Millionen Komposita sind halbautomatische Lösungen geplant: Das digitale Wörterbuch soll selbst ungewöhnliche Zusammensetzungen zu erkennen und erläutern können.

Der Begriff "Hetzjagd" wurde neu gefasst

Wird es dem ZDL gelingen, das digitale Wörterbuch zu einer festen Größe im deutschen Wissenschaftsbetrieb zu machen? Wird auch die Öffentlichkeit die Website regelmäßig anklicken? Nach Geykens Ansicht hängt das auch davon ab, ob und wie das ZDL künftig auf gesellschaftliche Debatten reagieren kann.
Als im Herbst 2018 ganz Deutschland über die Bedeutung des Wortes „Hetzjagd“ diskutierte, haben die Wissenschaftler den alten Eintrag prompt überarbeitet. Dass das Wort aus der Jägersprache stammt, ist bekannt. Es kann aber auch „an eine Hetzjagd erinnerndes, Leib und Leben gefährdendes Verfolgen und körperliches Bedrängen eines oder mehrerer Menschen durch eine Gruppe oder Menschenmenge“ bedeuten – so steht es nun im DWDS. „Leider kamen wir damit knapp zu spät, als die Diskussion schon wieder abgeflaut war.“ Mit dem größeren Team des ZDL soll sich das ändern. Künftig wollen die Berliner Lexikographen Sprachdebatten fast in Echtzeit abbilden oder kommentieren können.
Am 1. Januar hat das BMBF-geförderte Zentrum für digitale Lexikographie der deutschen Sprache seine Arbeit aufgenommen. Am 29. Januar findet eine öffentliche Auftaktveranstaltung statt (14 Uhr Projektvorstellung und wissenschaftliches Programm, 19 Uhr Abendvortrag Klaus-Dieter Lehmann vom Goethe-Institut). Ort: Berlin-Brandenburgische Akademie der Wissenschaften, Markgrafenstraße 38, 10117 Berlin. Der Eintritt ist frei; um Anmeldung wird gebeten: kschroeder@bbaw.de.

Twitter

Folgen Sie unserer Wissen und Forschen Redaktion auf Twitter: