Sprechen statt tippen : Zum Diktat, bitte

Ganz ohne Training geht es nicht. Danach können Programme zur Spracherkennung durchaus überzeugen. Dragon Naturally Speaking und Voice Pro im Tagesspiegel-Vergleich.

Kurt Sagatz
278909_0_a5cebe74.jpg
Für gute Verständigung sorgen Spezial-Headsets mit digitaler Technik.Foto: pa/dpa

Es ist wie mit dem Traum vom Fliegen. Seit der TV-Serie „Raumschiff Enterprise“ wünscht sich zumindest ein Teil der Menschheit, mit dem Computer auf ganz natürliche Weise reden zu können. Nicht wie mit einem Freund in einem echten Dialog, eher wie mit einer Sekretärin beim Diktat. Vor allem zwei Computerprogramme konkurrieren seit vielen Jahren darum, wer diesen Traum am besten erfüllen kann – wobei über den Erfolg gestritten werden kann. Nachdem die Firma Nuance bereits im letzten Jahr die neue Version von Dragon Naturally Speaking 10 veröffentlicht hat, liegt nun auch von Linguatec die neue Version Voice Pro 12 vor. Nuance wirbt mit einer verbesserten Erkennungsgenauigkeit von 20 Prozent gegenüber dem Vorgänger und bei Linguatec heißt es, dass Voice Pro ein Drittel weniger Erkennungsfehler macht. Wir haben die Programme gegeneinander antreten lassen.

Zum Einsatz kam das für Privatanwender gedachte Dragon Naturally Speaking Preferred 10 (rund 200 Euro) sowie Voice Pro 12 Premium (169 Euro), das sich genauso an Profi-Nutzer richtet. Als Testsystem diente ein drei Jahre alter Mittelklasse-Pentium-4-Rechner mit 3-Gigahertz-Prozessor. Die Programme wurden mit Texten aus dem Lokalteil dieser Zeitung gefüttert, bei dem es unter anderem um die gescheiterte Bürgerinitiative für ein Volksbegehren gegen ein Rauchverbot in Gaststätten ging. Dragon Naturally Speaking kam mit dem Anliegen der „Initiative für Genuss“ erstaunlich gut zurecht. Für Berliner Spezialbegriffe wie Pro Reli oder Hertha-Spiele musste zwar der Korrekturdialog beziehungsweise die Buchstabierhilfe aufgerufen werden, den Namen von Initiator Thoma Michel schrieb das Programm mit dem Drachen im Namen jedoch von Anfang an genauso korrekt wie die sonstigen Teile des Textes. Konkurrent Voice Pro hatte erheblich mehr Probleme mit den Feinheiten im Text über das im Ansatz gescheiterte Volksbegehren. Und das hat nichts mit Berlin zu tun, denn das „kleine Budget“ kennt man auch außerhalb der Hauptstadt.

Besser wurde Voice Pro erst, als eine weitere Trainingseinheit nachgeschoben wurde, damit sich das Programm an die Besonderheiten der eigenen Stimme gewöhnen kann. Auch das aktive Korrigieren half, denn Spracherkennungsprogramme lernen aus ihren Fehlern. Vor allem Eigennamen, fremdsprachliche Ausdrücke oder anderes Spezialvokabular sollten konsequent trainiert werden, auch wenn dadurch die Texterfassung erst einmal länger dauert.

Insgesamt zeigen die hohen Versionsnummern, dass man es mit ausgereiften Anwendungen zu tun hat. Die reine Installation ist in beiden Fällen rasch und unkompliziert erledigt. Dragon packt rund 280 Megabyte auf die Festplatte. Die Seriennummer muss bereits bei der Programminstallation angegeben werden. Voice Pro bringt es auf fast 300 Megabyte Festplattenplatz. Die Nummerneingabe und Aktivierung kann man maximal 30 Tage aufschieben. Die Headsets lassen sich problemlos anschließen, da sie per USB mit dem Computer verbunden werden und nicht über die Soundkarte. Die hochempfindlichen Mikrofone wurden für die Spracherkennung optimiert, so dass die Einrichtung eine Formalität ist. Bevor mit dem Sprechen des Textes begonnen werden kann, muss bei beiden Programmen ein neues Benutzerprofil erstellt werden. Der wichtigste Punkt dabei ist das Stimmtraining. Je nach Sprechtempo werden dabei fünf bis zehn Minuten lang vorgegebene Texte gelesen, damit der Computer daraus die individuellen Besonderheiten des Sprechers analysieren kann.

Ein gewichtiger Unterschied zwischen den Programmen liegt in der Betriebssystem-Unterstützung. Dragon Naturally Speaking funktioniert sowohl mit Windows XP als auch Vista. Voice Pro hingegen will von XP nichts mehr wissen. Dafür klappt neben Vista bereits jetzt die Arbeit unter Windows 7.

Die Spracherkennungsprogramme können zugleich zur Steuerung des Computers genutzt werden. Statt sich umständlich durch die Menüs zu hangeln, reicht zum Beispiel der gesprochene Befehl „Öffne Mail“ aus, um die als Standardmailprogramm in Windows angemeldete Anwendung direkt zu öffnen. Das Adressfeld ist jedoch per Hand erheblich schneller ausgefüllt als mit dem Mikrofon. Denn um die Adresse info@firma.de anzugeben, muss die umständliche Aufforderung „Kleinschreibung-anfangen info Ohne-Leerschritt Klammeraffe Firma Punkt de Kleinschreibung-beenden“ in das Mikro gesprochen werden – was in den wenigsten Fällen auf Anhieb fehlerfrei gelingt. Ähnlich verhält es sich mit Internetadressen. Bevor man mit Dragon oder Voice Pro zur Adressleiste gewechselt hat und die Adresse fehlerfrei ohne Umlaute und trotz Anglizismen eingegeben hat, wären selbst weniger flinke Finger mit der Tastatur längst fertig.

Fazit: Spracherkennungsprogramme haben eine erstaunlich hohe Erkennungsqualität erreicht. Dies gilt vor allem für Dragon Naturally Speaking von Nuance. Bereits nach der Standardinstallation und einigen Trainings- und Korrektursitzungen kann man sich beinahe blind auf das Programm verlassen. Bei Voice Pro 12 von Linguatec sollte man das nicht so schnell tun. Der Wechsel von der IBM-Technologie zu Microsoft hat zwar die Windows-Integration verbessert, doch noch macht das Programm am Anfang erheblich mehr Fehler als der Konkurrent. Wozu die beiden Programme in der Lage sind, lässt sich ohnehin erst nach einiger Zeit abschätzen, wenn auch die weniger geläufigen Befehle an die Reihe kommen. Und noch eins gilt für beide Programme: Am besten geeignet sind sie für Menschen mit eigenem Büro. Gute Ergebnisse erzielt man nämlich, wenn man ähnlich betont spricht wie ein Nachrichtensprecher – und das kann die Kollegen schnell nerven.

www.nuance.de 
www.linguatec.de

0 Kommentare

Neuester Kommentar