Zeitung Heute : Wenn der Computer aufs Wort gehorcht

KURT SAGATZ

Programme zur Spracherkennung überraschen mittlerweile durch hohe ErkennungsgenauigkeitVON KURT SAGATZ

"Diktiermodus - Dies ist ein Test - Befehlsmodus - Datei - Speichern - o.k.".Mit diesen Anweisungen - gesprochen in ein mit einem Computer verbundenes Mikrophon - wurde der kurze Satz "Dies ist ein Test" geschrieben und auf der Festplatte gespeichert.Und zwar ganz ohne Tastatur.Worum es geht? Die Rede ist von computergestützten Spracherkennungssystemen, von Programmen also, die in der Lage sind, den Computer mit der menschlichen Stimme zu steuern und Wörter ohne Tastatur aufzuzeichnen.Das Erstaunlichste daran: Diese Systeme überraschen durch hohe Erkennungsgenauigkeit.Um den deutschsprachigen Kunden buhlen zwei Software-Firmen.Neben IBM mit VoiceType (für Windows und OS/2, dort bereits in einer Light-Version integriert) bietet noch das US-Unternehmen Dragon Systems mit DragonDictate (Windows) ausgereifte Lösungen an. Daß man sich heutzutage überhaupt ernstzunehmende Gedanken über die Nutzung solcher Systeme machen kann, hängt vor allem mit der dramatischen Leistungszunahme der PCs zusammen.Noch vor wenigen Jahren wäre eine solche Technologie jenseits der Rechenzentren undenkbar gewesen, heutzutage reicht ein handelsübliches Gerät mit Pentium-Chip und 16 Megabyte Speicher aus.Allerdings wachsen auch bei diesen Programmen die Bäume nicht in den Himmel: Wer glaubt, das System verstünde ihn gleich nach der Installation ohne Mißverständnisse, der irrt.Bevor auch kompliziertere Wörter wie beispielsweise Eigennamen korrekt übernommen werden, muß das System erst an den jeweiligen Sprecher gewöhnt werden.Der Durchlauf des eingebauten Trainingsmoduls hilft zwar beim Umschiffen der größten Klippen.Bis es reibungslos funktioniert, müssen jedoch mehrere Stunden konsequent geübt werden.Zum Trost: Das Erlernen des 10-Finger-Schreibmaschinen-Systems dauert in der Regel deutlich länger. Der nicht gerade geringe Preis für die Vollversionen der Programme und die Dauer der Eingewöhnung sprechen somit dagegen, daß Diktieren am PC zum Volkssport wird.Hinzu kommt, daß andere Mitarbeiter durch das monotone Reden im Stakkatotakt - zwischen den einzelnen Worten müssen kurze Pausen eingefügt werden, damit das Programm den Text wortweise abarbeiten kann - gestört werden können. Genutzt werden solche Programme daher derzeit nur von sehr wenigen Menschen, vor allem von Ärzten und Anwälten.Bei diesen Berufsgruppen mit ihren hohen Stundenhonoraren wird deutlich, wie ärgerlich die langwierige Eingewöhnungsphase ist.Immerhin wurden für sie besondere Module mit dem entsprechenden Fachvokabular programmiert.So umfaßt bei IBM die Standardversion von Voice-Type 30 000 Worte, Dragon-Dictate Pro bringt es auf 60.000 und die Erweiterung für Juristen fügt noch einmal 120.000 Worte an.Dem Programm muß also nicht der gesamte Wortschatz beigebracht werden, vielmehr reicht es aus, daß dem System genügend Phone des jeweiligen Sprechers bekannt sind, um auch untrainierte Worte zweifelsfrei zu erkennen.Und Zweifel sind nicht erlaubt, sowohl bei Ärzten als auch Juristen.

Weitere Informationen: VoiceType:

Tagesspiegel - Debatten


Hintergründe und Expertisen zu aktuellen Diskussionen: Tagesspiegel Causa, das Debattenmagazin des Tagesspiegels.

Hier geht es zu Tagesspiegel Causa!

0 Kommentare

Neuester Kommentar