zum Hauptinhalt

Homepage: Ohne störende Pausen

Computerlinguist will bessere Sprachsysteme

Stand:

„Nennen Sie bitte den gewünschten Start- und Zielbahnhof“, fordert die Computerstimme freundlich. Dr. David Schlangen, Computerlinguist von der Uni Potsdam, hat die Nummer der Bahnauskunft gewählt. „Ich möchte gerne von Berlin nach Frankfurt fahren.“ Zögern am anderen Ende. Dann die Antwort: „Wie bitte?“. Was Dr. Schlangen demonstrieren wollte, ist die entstandene Pause zwischen seiner Aussage und der Antwort. Das werde als unnatürlich empfunden und mache das Sprechen mit einem Sprachdialogsystem unangenehm.

Gespräche zwischen Menschen funktionieren besser. Nahezu reibungslos klappt der Wechsel der Sprecher in der Regel. Es entstehen kaum Pausen, ohne dass man sich deshalb gegenseitig ins Wort fällt. Dafür ist es nötig, zu wissen, wie eine Aussage enden wird, bevor sie zu Ende ist, erläutert Schlangen. Er nennt ein Beispiel: Beginnt man eine Frage mit den Worten „Warst du gestern“, sind die Möglichkeiten bereits sehr eingeschränkt, wie diese enden wird. Der Gesprächspartner kann sich denken, wie die komplette Frage lautet und bereits auf die Antwort vorbereiten, während sie noch gestellt wird.

Ähnlich funktioniert T9 (Text on 9 keys), dass das SMS-Schreiben einfacher gemacht hat. Auch dieses System, bei dem eine Handytaste nur einmal gedrückt werden muss, obwohl ihr mehrere Buchstaben zugeordnet sind, macht sich den Umstand zu Nutze, dass jede Tastenfolge nur einer geringen Anzahl von sinnvollen Wörtern entspricht. Der Unterschied ist, dass T9 nur die fehlenden Buchstaben eines Wortes, nicht aber die fehlenden Worte eines Satzes voraussagt.

Menschen sind dazu in der Lage, Computer bisher nicht. Sie können eine Aussage nur als Ganzes verarbeiten und beginnen folglich damit, nachdem die Aussage beendet ist. Es entsteht eine Pause. Doch das will Schlangen nun ändern. Der 34-Jährige möchte ein Computersystem entwickeln, mit dem man sich unterhalten kann, wie mit einem Menschen. Der Computer soll Aussagen stückweise verarbeiten können. Inkrementelle Verarbeitung heißt das im Fachjargon. Er betrete damit relatives Neuland und betrachte sich mindestens zur Hälfte als Grundlagenforscher, sagt Schlangen. Für sein Forschungsvorhaben hat er gerade die Zusage von der Deutschen Forschungsgemeinschaft (DFG) erhalten, die das Projekt mindestens drei Jahre lang fördern wird. Was dabei herauskommen wird, steht noch in den Sternen, das Projekt an seinem Anfang.

Dr. David Schlangen wird sich mit der Satzmelodie, der Prosodie, befassen. Gerade bastelt er an einem Computersystem, das er scherzhaft „Gespräch mit der Schwiegermutter“ nennt. Dieses soll an den richtigen Stellen „Aha“ oder „Hm“ sagen und sich dafür ausschließlich an der Tonhöhe orientieren. Auch Syntax und Semantik gilt es zu untersuchen. Also die Muster, nach denen Wörter zu Sätzen zusammengesetzt werden und der Wortsinn. Möglicherweise wird sich herausstellen, dass deren Zusammenspiel zu komplex ist, um es zu entschlüsseln. Vielleicht aber wird auch in nicht allzu ferner Zukunft eine freundliche Computerstimme ohne zu Zögern fragen: „Wie bitte?“ Sebastian Ehrlich

Sebastian Ehrlich

Zur Startseite

showPaywall:
false
isSubscriber:
false
isPaid:
console.debug({ userId: "", verifiedBot: "false", botCategory: "" })