zum Hauptinhalt

Gesundheit: Sieh mal, wer da spricht

Die Sprechererkennung ist ein wichtiges Hilfsmittel der Polizei. Denn wer die Stimme erhebt, verrät viel über sich

Im Oktober 1991 rief ein Mann den Notruf der Polizei an. Als die beiden Holzmindener Beamten Andreas Wilkending und Jörg Lorkowski auf dem Waldparkplatz in Boffzen (bei Höxter) eintrafen, wurden sie von ihm erschossen. Es war der Notruf, den die ermittelnden Beamten mit dazu einsetzten, um auf die Spur des Täters zu kommen. Rundfunksender hatten den Anruf veröffentlicht, zuvor jedoch war er ausführlich analysiert worden. So ließ sich ein Täterprofil erstellen und bald darauf konnte der damals 29-jährige Dietmar Jüschke festgenommen werden. Die Sprechererkennung ist inzwischen nämlich ein gut entwickeltes Werkzeug, mehr Fakten über Unbekannte zu gewinnen – wie jüngst auch in USA über die „Sniper“-Mörder.

Wer öffentlich zum Mikro oder auch nur zum Telefonhörer greift, gibt viel über sich preis. Die Stimme selbst ist freilich nur ein Teil dessen, was die Mitarbeiter beim Bundeskriminalamt (BKA) anhand mündlicher Äußerungen analysieren. So lassen sich Aufzeichnungen nicht nur individuelle, sondern auch regionale und soziale Merkmale entnehmen. Selbst ein leichter Anflug von Dialekt gibt schon Hinweise darauf, wo ein Mensch seine „Sprachprägephase“, also die Schulzeit, verbracht hat.

Je stärker diese Färbung durchscheint, desto geringer ist meist auch der Bildungsgrad – da macht nur das Bayrische eine Ausnahme, wird im Fachbuch „Kriminalistische Kompetenz“ vermerkt. Die Verfasser der Kapitel Sprechererkennung, Christa Baldauf und Stefan Gfroerer, sind Experten des Kriminaltechnischen Instituts beim BKA, sie fertigen für Polizei, Staatsanwaltschaften und Gerichte Gutachten an.

Wer spricht, lässt durch seinen Wortschatz und seine sprachliche Ausdrucksfähigkeit unbewusst Informationen aus seinem Umfeld einfließen. Dem Soziolekt können die Fachleute bestimmte Gruppenzugehörigkeiten entnehmen – nicht nur Unterschicht-Kennzeichen: Die Kriminalisten achten auf Unterschiede zwischen „sprechenden Berufen“ wie Rechtsanwälten und Vertretern einerseits und „nicht sprechenden“ wie Handwerker oder Landwirt andererseits.

Wichtig für die Tätersuche – und der Stimme zu entnehmen – sind natürlich das Geschlecht und das Alter des Gesuchten. Wobei auch hier Vorsicht gilt: starke Raucher und Trinker klingen älter als sie sind. Wer im Verlauf der Untersuchung Verdächtige aus einer bekannten Gruppe herausfischen will, muss auf weitere individuelle Merkmale achten. Das können zum Beispiel Sprech- und Atempausen sowie die Intonation sein.

In mehr als 95 Prozent der Fälle, in denen ein Täter droht oder fordert, werden den Experten Mitschnitte von Telefonaten eingereicht. Für eine aussagekräftige Analyse brauchen sie 20 bis 30 Sekunden Text, allerdings ist die Qualität der Telefonübertragung oft ein Hindernis. Denn die reicht nur bis etwa 3400 Hertz, was die eindeutige Erkennung hochfrequenter Laute – etwa beim Lispeln – erschwert.

Und die sonst viel gepriesene digitale Mobilfontechnik hilft auch nicht weiter, denn die arbeitet mit kräftiger Datenreduktion. Zudem verstellt jeder dritte Täter seine Stimme, was die Auswertung ebenfalls einschränken kann.

Andererseits hilft die Elektronik, schlechte Aufzeichnungen aufzubessern. Wie beim Überarbeiten der Musik von zerkratzten Schallplatten können Knackser der Übertragung, Brummgeräusche und Hall herausgefiltert werden. Leise Passagen werden verstärkt und gegebenenfalls vom Rauschen befreit. Aber auch der Computer hat Grenzen: Völlig unverständliche Aufzeichnungen lassen sich selbst mit modernen Programmen nicht retten.

Informationen darüber, welche technischen Möglichkeiten sie haben, möchten die BKA-Fachleute verständlicher Weise nicht preisgeben. Hinweise darauf, was heute schon möglich ist, lassen sich aus verwandten Bereichen ziehen. Auch da geht es um Sicherheit – etwa darum, gefährdete Räume für Unbefugte zu sperren und nur überprüftem Personal den Zugang zu gewähren.

Die Biometrie hat in den vergangenen Jahren deutliche Fortschritte gemacht. Fingerabdruck-Sensoren zum Beispiel sind allenthalben einsatztauglich und preiswert geworden. Scanner, die die Iris des Auges abtasten, sind auch schon in Betrieb. Das städtische Krankenhaus in Bad Reichenhall etwa nutzt das Verfahren neuerdings für die Kontrolle des Zugangs zur Säuglingsstation, um Kindesentführungen zu verhindern.

Da sich ein körperliches Merkmal allein durch äußere Einflüsse des täglichen Lebens schnell ändern kann, sind solche Techniken nur dann wirklich sicher, wenn sie mehrere Abfrageebenen einbeziehen. Die Stimme kann dabei helfen. Ein Gerät der Sprechererkennung untersucht die Stimme auf die verwendeten Frequenzen und die Lautstärke dieser Frequenzanteile. Bei Zugangs-Kontrollsystemen kann man sich freilich auf die Mitarbeit des zu Prüfenden verlassen, er wird aufgefordert, bestimmte Testworte zu sprechen. Meist wird das nach einigen Wochen wiederholt, damit die Aufzeichnung auch kleinere Änderungen berücksichtigen kann.

Für den laufenden Betrieb braucht das Gerät dann „nur“ noch die hinterlegten mit den aktuellen Daten zu vergleichen. Eine solche Mitwirkung des Betroffenen ist beim Stimmenvergleich in der Kriminalistik eher nicht zu erwarten. Hier kommt es aber ebenfalls darauf an, eine möglichst klare Referenzaufnahme zu erhalten, die dem Verdächtigen eindeutig zuzuordnen ist. Erst dann ist ein genauer Vergleich mit der zu untersuchenden Probe möglich.

So genau wie Vergleiche von Fingerabdrücken ist die Stimmanalyse nach Auskunft von Fachleuten aber (noch) nicht. Zwar sind die körperlichen Merkmale, die zu einer „ganz eigenen“ Stimme führen, individuell genug – es dürfte also tatsächlich keine zwei Menschen mit der selben Stimme geben. Aber die Möglichkeiten sie zu verstellen oder andere Hindernisse für Nachforschungen einzusetzen sind vielfältig. Und dann kommen eben noch die Hintergrundgeräusche sowie andere Störfaktoren wie Hall hinzu.

Doch geforscht wird intensiv – schon weil eine stets zuverlässige, ohne große Vorübung funktionierende Erkennung gesprochener Worte allenthalben einsetzbar wäre, auch bei der Steuerung von Maschinen oder bei Diktaten am Computer. Programme dafür gibt es schon seit einigen Jahren. Nur: Wer es damit mal versucht hat, hofft umso inständiger auf weitere Entwicklungsschritte.

Gideon Heimann

Zur Startseite

showPaywall:
false
isSubscriber:
false
isPaid:
showPaywallPiano:
false