Wissen : Sprich mit mir

Mit der Stimmerkennung sollen Personen identifiziert werden – aber die Methode ist noch nicht ausgereift

Frank Schubert

Personen an ihren Stimmen erkennen – das können Menschen automatisch. Mittlerweile lernen auch Computer, ihre Benutzer an der Sprechweise zu erkennen. Die Stimme wird somit zu einem nutzbaren biometrischen Merkmal. Das lässt sich zwar relativ preisgünstig erfassen, doch mitunter fehlt den Verfahren die nötige Genauigkeit. Schlimmstenfalls erhalten Personen Zugriff auf Daten, obwohl sie das gar nicht dürften – oder der rechtmäßige Bearbeiter bleibt außen vor.

„Anders als die Worterkennung, die bestimmte Formulierungen erkennt, identifiziert Stimmerkennung einen Menschen anhand seiner Sprache“, sagt Jörn Kranigk von der Firma Bergdata Biometrics in Bonn. Er arbeitet an einem Gerät, das künftig in Türsprechanlagen eingesetzt werden soll, um etwa Mitarbeiter einer Firma zu identifizieren und einzulassen.

Dass Menschen anhand ihrer Stimme erkannt werden, liegt einerseits in der Anatomie begründet. „Jeder von uns hat einen individuellen Sprachapparat“, sagt Kranigk. Dazu zählten Stimmbänder, Nasenraum, Kehlkopf und Brustkorb. Die Organe unterscheiden sich von Mensch zu Mensch und erzeugen charakteristische Resonanzeigenschaften. „Außerdem hat jeder Mensch unterschiedliche Sprechgewohnheiten“, sagt Kranigk. Diese Unterschiede geben jeder Stimme ihren eigenen Klang.

Genau dort setzt Kranigks Methode an. Sie analysiert die Schwingungen der – mittels Mikrofon aufgenommenen – Sprache, um auffällige Frequenzen zu finden, bei denen die Schallintensität ungewöhnlich hoch oder niedrig ist. „An diesen Stellen weicht die Stimme am stärksten von einem idealen Rauschen ab, dessen Lautstärke bei allen Frequenzen gleich groß ist“, erklärt der Physiker. Anhand dieser Frequenzmuster konnte Kranigk im Labor bereits Gesprochenes den richtigen Personen zuordnen. Dazu war allerdings ein separater Computer nötig. Bis die Spracherkennung auf einen Mikrochip passt, der in jeder Türsprechanlage eingebaut werden kann, wird es noch ein Jahr dauern, schätzt der Physiker.

Allerdings gibt es viele Menschen mit ähnlichen Stimmen, gibt Kranigk zu bedenken. Das mache die Stimmerkennung weniger leistungsfähig als andere biometrische Verfahren wie etwa die Iriserkennung. „Wenn eine Stimmdatenbank mehr als 100 Personen umfasst, gibt es zu viele ähnliche Einträge“, sagt Kranigk. Eine bestimmte Person könne dann oft nicht mehr sicher zugeordnet werden.

„Ein weiterer Nachteil besteht darin, dass die menschliche Stimme relativ große Schwankungen zeigt – abhängig von der Tagesform, aber auch von Krankheiten, vom Alkohol- und Zigarettenkonsum“, sagt Kranigk. Das könne dazu führen, dass ein technisches System eine Stimme nicht mehr korrekt erkennt. Zudem ist die Qualität von Mikrofonen oft eingeschränkt, was den Sprachklang verzerrt und ebenfalls zu Erkennungsproblemen führen kann. „Und es gibt meist Hintergrundgeräusche, wenn der Nutzer ins Mikro spricht“, sagt der Physiker. Dieser Lärm lässt sich beispielsweise mit Array-Mikrofonen herausfiltern. Dabei handelt es sich um ein Netz von meist fünf bis zehn Mikrofonen, deren Signale von einem Computer analysiert werden. Weil sich die Einzelmikrofone an unterschiedlichen Orten befinden, kann der Rechner die Position des Sprechers erkennen und mutmaßliche Störgeräusche aus anderen Richtungen herausfiltern.

Wegen der vielen Unsicherheiten, sagt Kranigk, ließe sich die Stimmerkennung leicht täuschen. Oftmals genüge es, eine Tonaufnahme abzuspielen, um das System zu überlisten: „Dagegen kann man wenig machen.“ Um sicher zu sein, sollten dann weitere Verfahren wie Fingerabdruck- oder Iriserkennung eingesetzt werden.

Einen anderen Weg geht die Münchener Firma Voicetrust, ein führendes Unternehmen auf dem Gebiet der Stimmerkennung. „Zusätzlich zu den charakteristischen Frequenzen untersuchen wir den Sprechrhythmus und das Klangvolumen“, sagt Marc Mumm von Voicetrust. „Das Verfahren arbeitet zuverlässig, es kommt nur sehr selten zur Verwechslung von Nutzern“, sagt er. Die Personenerkennung über das Telefon funktioniere im Festnetz schon jetzt ohne Probleme.

Ein wesentlicher Vorteil der Stimmerkennung besteht darin, dass sie – verglichen mit anderen biometrischen Verfahren – preiswerter ist, weil sie ohne großen technischen Aufwand auskommt. Zu genauen Preisen machen die Hersteller von Sicherheitssystemen jedoch keine Angaben, denn für jeden Kunden werden die Anlagen individuell geplant und gebaut.

„Für Privatanwender ist die Stimmerkennung beispielsweise interessant, wenn man am Telefon Geschäfte macht, oder eben bei Türsprechanlagen“, sagt Kranigk. So ließe sich mit wenig Aufwand immerhin ein gewisses Sicherheitsniveau erreichen. Frank Schubert

0 Kommentare

Neuester Kommentar
      Kommentar schreiben