zum Hauptinhalt

Jahr der Geisteswissenschaften: Das Geheimnis der Wörter

Computerlinguisten erforschen, was Menschen in ihrem geistigem Lexikon speichern

Im Jahr der Geisteswissenschaften bittet der Tagesspiegel herausragende Vertreter geistes- und kulturwissenschaftlicher Fachgebiete um kurze Aufsätze zu einem Forschungsthema, das sie gerade beschäftigt. Sie geben Einblicke in die Arbeitsweise von Geisteswissenschaftlern, in ihre Methoden und aktuellen Forschungsansätze. Diese Werkstattberichte sollen die Vielfalt geisteswissenschaftlicher Arbeit zeigen.

Die Computerrevolution hat die Sprachforschung bedeutend beeinflusst. Theorien über den Erwerb, Gebrauch, und Wandel der Sprache beruhen nicht mehr ausschließlich auf Introspektion und Intuition der Forscher, sondern können anhand digitaler Corpora entwickelt werden. Das sind große Textsammlungen, die über Computerprogramme gezielt abgefragt werden und die das Verhalten vieler Sprecher in verschiedenen Kontexten und Zeitabschnitten dokumentieren. Corpora haben auch der Wortschatzforschung und Lexikografie einen Quantensprung ermöglicht.

Digitale Wörterbücher erlauben eine alternative Abbildung des Lexikons einer Sprache. Traditionelle Papierwörterbücher sind gezwungenermaßen alphabetisch, also nach orthografischen oder phonologischen Prinzipien organisiert, damit der Benutzer das Zielwort findet. Das ist praktisch, aber wissenschaftlich uninteressant. Experimente zeigen, dass Menschen Wörter und die dahinterstehenden Konzepte hauptsächlich mittels semantischer Beziehungen, also Bedeutungsprinzipien, in ihrem „geistigen Lexikon“ speichern. Ein digitales Wörterbuch erlaubt eine psychologisch realistische Darstellung unseres erstaunlich großen Wortschatzes.

Eine besondere Art von Wörtern sind Mehrwortausdrücke wie „die Katze aus dem Sack lassen“, „am Hungertuch nagen“ oder „kein Blatt vor den Mund nehmen“. Diese alltäglichen Phrasen sind faszinierend, weil Sprecher sich ihrer Besonderheit bewusst sind und erkennen, dass sie eine Einheit, ein „langes Wort“ bilden. „Nagen“ gehört zum „Hungertuch“ ebenso wie die Negation („kein“) zum „Blatt vor dem Mund“. Als Wortkombinationen sind diese Phrasen oft ungewöhnlich oder regelverletzend; sie werden nicht erneut vom Sprecher zusammengestellt, sondern als fertige Einheiten gespeichert und abgerufen. Ihre Komponenten haben oft keine eigenständige Bedeutung. Manche sind obskur („Hungertuch“), andere nicht interpretierbar: Was ist der Pantoffel, unter dem ein untergebutterter Ehemann steht, und wodurch geht das, was einem „durch die Lappen“ geht?

Die hervorstechendste Eigenschaft dieser Idiome ist nämlich, dass sich ihre Gesamtbedeutung nicht aus der Summe ihrer Teilwörter ergibt. So spaziert man nicht auf dem Gaumen, wenn man auf dem Zahnfleisch läuft, und schaufelt nicht, wenn man jemanden auf die Schippe nimmt. Natürlich kann man auch im wörtlichen Sinn eine Katze aus dem Sack lassen. In dem Fall ist es eine aus einzelnen Wortbausteinen zusammengesetzte Botschaft, die der Sprecher wie tausend andere je nach Bedarf neu formuliert und die sich nicht auf ein Geheimnis, sondern einen Vierbeiner bezieht. Für viele Idiome ist eine wörtliche Lesart kaum möglich („jemandem auf der Nase herumtanzen“) oder undenkbar („sich die Nacht um die Ohren schlagen“).

Man wird sich der semantischen Besonderheit dieser Ausdrücke spätestens klar, wenn man auf ein unbekanntes Idiom in der eigenen oder in einer Fremdsprache stößt. Sprecher wissen intuitiv, dass Idiome nicht wörtlich in eine andere Sprache übersetzt werden können. Jede Sprache besitzt Idiome und Begriffe, die mit geistigen und körperlichen Eigenschaften, menschlichem Verhalten – besonders anderen gegenüber – zu tun haben. Sie werden von vielen Sprachen als Idiome kodiert, wenn sie auch oft auf anderen Bildlichkeiten basieren. So ist das englische Äquivalent von „jemanden auf den Arm / die Schippe nehmen“ „pull somebody’s leg“.

Wenn wir davon ausgehen, dass Sprache ein geregeltes System ist, dann stellt sich die Frage: Warum sind Idiome, die die Normen der Kompositionalität verletzen, ein so fester und großer Bestandteil jeder Sprache? Eine einfache Erklärung ist, dass Idiome oft euphemistisch körperliche Zustände ausdrücken (beispielsweise den Tod); andererseits können sie auch derb sein: Viele Phrasen drücken eine geringe Einschätzung der geistigen Fähigkeiten eines anderen aus. Die weitverbreitete Annahme, dass Idiome immer umgangssprachlich sind und im formellen Sprachgebrauch vermieden werden sollen, ist allerdings falsch. Viele Idiome wie „die Gelegenheit beim Schopf nehmen“, „den Faden verlieren“, „sein Licht nicht unter den Scheffel stellen“ oder „den Nagel auf den Kopf treffen“ sind durchaus salonfähig und fester Bestand der Schriftsprache.

Für manche Idiome gibt es äquivalente einfache Wörter (auf die Nerven gehen/nerven; auf den Arm nehmen/verulken). Aber viele Wendungen füllen „lexikalische Lücken“. Sie nehmen einen Platz im Lexikon der Sprache ein, der nicht von einem einfachen Wort besetzt ist und wo einem Konzept der sprachlichen Ausdruck fehlt. Oft sind es komplexe Begriffe, die nicht angemessen mit einem Wort ausgedrückt werden können, wie beispielsweise „zwischen zwei Stühlen sitzen“ oder „den Sack schlagen und den Esel meinen“. Interessant sind die vielen Idiome mit einer obligatorischen Negationskomponente („sich keinen Reim auf etwas machen können“, „nicht auf den Kopf gefallen sein“), denn einfache Wörter drücken selten ein Nichttun oder einen Nichtzustand aus.

In vieler Hinsicht unterscheiden sich Idiome nicht von einfachen Wörtern. Sie können mehrere Lesarten haben („vom Leder ziehen“). Auch unterliegen sie den normalen Regeln des Sprachwandels. Neue Wendungen werden aufgenommen („das ist nicht mein Tag“), andere veralten („sich in Wichs werfen“). Wieder andere nehmen neue Bedeutungen an: „in die Röhre schauen“ bedeutete zunächst nur „leer ausgehen“, aber spätestens seit 1970 ist auch die zusätzliche Bedeutung „fernsehen“ belegt. „Unter dem Pantoffel“ (der Ehefrau) standen früher nur Ehemänner; mittlerweile kann dieser Status auch Ehefrauen, Singles, Angestellten und sogar Städten zugeschrieben werden, die von (Ehe-)Männern, Vorgesetzten oder Regierungsinstitutionen beherrscht werden.

Die Auswertung der digitalen Corpora stellt oft linguistische Theorien infrage. Eine Grundannahme ist, dass bei der Sprachproduktion Wörter aus dem mentalen Lexikon abgerufen werden und in die entsprechenden „Slots“ im Satz (Subjekt, Objekt etc.) eingefügt werden. Das scheint im Falle von einfachen Wörtern konsensuell. Für Mehrwortausdrücke wie Idiome hieße es, dass sie als einheitliche „lange Wörter“ eingesetzt werden. Corpora zeigen jedoch, dass die Worteinheiten nicht nur aufgebrochen, sondern auch verändert werden. So finden wir neben „er nahm kein Blatt vor den Mund“ auch andere Formen der Negation („er nahm nie ein Blatt vor den Mund“, „seine Art, selten ein Blatt vor den Mund zu nehmen“), Affirmation statt Negation („ein Regierungssprecher ist ein Mann, der 100 Blätter vor den Mund nimmt“), Umstellungen der Idiomkomponenten („mit so einem kecken Mund, vor den kein Blatt genommen wird“) und neue Wortbildungen („kein Notenblatt vor den Mund“).

Diese Beispiele zeigen, dass Sprecher das Idiom nicht immer als Einheit, sondern durchaus wie eine frei komponierte Gruppe von Wörtern behandeln, selbst wenn das Idiom semantisch nicht dekomponierbar ist und „Blatt“ von zeitgenössischen Sprechern keine Bedeutung zugeschrieben wird. Obwohl die Mehrworteinheiten im mentalen Lexikon als Einheiten repräsentiert sind, brechen Sprecher sie auf und Hörer stellen sie wieder zusammen, auch dann, wenn die Kernkomponenten der Idiome nicht in ihren üblichen Formen oder Konstellationen auftreten. Die Beispiele zeigen, dass die Regeln der Grammatik auch Zugriff ins Innere dieser „langen Wörter“ haben.

Für Linguisten und Lexikografen sind Beschreibung und Analyse solcher alltäglichen Mehrwortausdrücke eine harte Nuss, die noch nicht ganz geknackt ist.

Zur Person:

Christiane Fellbaum ist eine der weltweit führenden Forscherinnen in der linguistischen Datenvereinigung. Als die 1950 in Braunschweig geborene Professorin an der Psychologischen Fakultät der Princeton University 2001 den Wolfgang-Paul-Preis der Humboldt-Stiftung erhielt, nutzte sie die Preissumme von 1,53 Millionen Euro, um mit einem Forschungsvorhaben nach Deutschland zurückzukehren. Fellbaum, die schon mit 19 Jahren zum Studium in die USA ging, baute das Projekt „Kollokationen im Wörterbuch“ an der Berlin-Brandenburgischen Akademie der Wissenschaften auf. Die Redewendungen, mit denen Fellbaum arbeitet, sind Teil des Digitalen Wörterbuchs der Deutschen Sprache (www.dwds. de). -ry

Die Serie im Internet:

www.tagesspiegel.de/Geisteswissenschaften

Christiane Fellbaum

Zur Startseite

showPaywall:
false
isSubscriber:
false
isPaid:
showPaywallPiano:
false