Siri, Google Now, Cortana : Das leisten die Smartphone-Assistenten

Mit Siri, Google Now und Cortana lassen sich Handys per Sprache steuern. Doch wie hilfreich sind die Assistenten wirklich?

von
Manchen Ärger kann man sich sparen: Während einer Autofahrt ist es verboten, ein Handy in der Hand zu halten. Dies ist auch gar nicht nötig, denn Sprachassistenten helfen dabei, zum Beispiel eine SMS zu versenden oder ein Telefonat einzuleiten. Foto: pa/dpa
Manchen Ärger kann man sich sparen: Während einer Autofahrt ist es verboten, ein Handy in der Hand zu halten. Dies ist auch gar...Foto: picture alliance / dpa

Manche Antworten entbehren nicht einer gewissen Komik. Auf die Frage „Was steht morgen an?“, sollte der Smartphone-Helfer Google Now eigentlich die Termine des nächsten Tages vorlesen. In unserem Test verstand das Assistenzsystem des Android-Handys die Aufforderung jedoch komplett falsch. Statt Treffen und Geburtstagen wurden verschiedene Webseiten herausgesucht. Auf einer wird erklärt, warum Männer morgens häufiger mit erigiertem Geschlechtsteil aufwachen. Auf einer anderen Seite geht es um das grundsätzliche Problem, das Jugendliche mit dem morgendlichen Aufstehen haben. Die Frage ist also: Wie gut sind die Sprachassistenten für Smartphones wirklich? Helfen Apples Siri, Google Now und Cortana von Microsoft zuverlässig dabei, dass man die Hände beim Autofahren am Lenker lassen kann, weil man seine SMS-Nachrichten oder Telefonanrufe mittels Sprachanweisungen erledigen kann? Und wofür taugen sie noch? In unserem Test kamen wir zu gemischten Ergebnissen.

DAS TESTFELD

Für diesen Beitrag kamen folgende Smartphones zum Einsatz: Siri von Apple wurde auf einem iPhone 5S ausprobiert, Google Now musste sein Können auf einem Samsung Galaxy Note Edge unter Beweis stellen, und das noch in der Beta-Phase befindliche Microsoft-System Cortana, das es derzeit nur für Windows Phone 8.1 gibt, lief auf einem Lumia 535. Cortana wird mit Windows 10 übrigens auch auf allen anderen Geräten mit diesem Betriebssystem laufen.

WIE WERDEN DIE ASSISTENTEN GESTARTET?

Siri, Google Now und Cortana können ihre Talente immer dann unter Beweis stellen, wenn der Nutzer keine Hand für manuelle Eingaben frei hat. Doch bereits bei der Aktivierung der Assistenten zeigen sich deutliche Unterschiede. Der Apple-Assistent Siri wird entweder aktiviert, indem der Home-Button des iPhones länger gedrückt wird. Ist das Smartphone per Ladekabel mit einer Stromversorgung verbunden, reagiert das Gerät jedoch auch auf das Kommando „Hey Siri“. Theoretisch sollte das also auch im Auto klappen, doch in der Praxis sind die Ladebuchsen in einigen Fahrzeugen nicht stark genug. Aber auch Android hat Probleme mit der Sprachaktivierung, denn auf „Ok Google“ reagieren nur einige Android-Geräte wie die Nexus-Reihe oder das Samsung Galaxy Note Edge ohne weiteres Zutun. Bei anderen Android-Geräten muss zuvor die Google- beziehungsweise die Google-Now- App händisch gestartet werden, um die Anfrage per „Ok Google“-Befehl in Auftrag zu geben. Und bei den Windows Phones ist die automatische Sprachaktivierung des Cortana-Befehlsmodus derzeit noch mit keinem in Deutschland erhältlichen Smartphone möglich. Stattdessen muss vor jedem Auftrag die Suchtaste länger gedrückt werden.

AUS ERFAHRUNG GUT?

Apple hat die längste Erfahrung damit, über seine Mobilgeräten Sprache in digitale Aufforderungen umzuwandeln und auszuführen. Die Programmierer haben dem Assistenzsystem Siri sogar ein gewisses Maß an Schlagfertigkeit und Humor beigebracht. In der Praxis noch wichtiger ist jedoch die weitreichende Integration von Siri in das Betriebssystem. Wichtige Funktionen wie Bluetooth oder W-Lan lassen sich zwar auch bei Android und Windows Phone per Sprachkommando ein- und ausschalten. Darüber hinaus sucht Siri auf Kommando sogar Apps direkt im App Store: Das klappt bei keinem anderen Konkurrenten.

STÄRKEN IM ALLTAGSBETRIEB

Ihre Stärken zeigen die Assistenten in täglichen Routineaufgaben. Anweisungen wie „Rufe XY auf dem Festnetz an“ oder „Schreibe eine SMS an XY“ erledigen alle Systeme gleich gut. Um Termine einzutragen oder Notizen zu schicken, reichen ebenfalls normal gesprochene Anweisungen aus, eine spezielle Syntax ist nicht erforderlich. Das gilt auch für Kommandos wie „Öffne tagesspiegel.de“ (Webseite öffnen). In der Regel funktioniert auch die Berechnung von Routen oder die Navigation, allerdings kommt es mitunter zu unerklärlichen Aussetzern. Das Kommando „Navigiere zum Bahnhof Zoologischer Garten“ stellt weder Siri noch Google Now oder Cortana vor Probleme. Aber bei „Navigiere zum Askanischen Platz“ schmeißt Google Now die Websuche an. Befand man sich bereits zuvor in Google Maps, tritt das Problem nicht auf. Auch bei anderen Navigationsaufgaben haben einige Systeme noch Lernbedarf. Während Siri sogar die Aufforderung „Zeige Route zu Firmenadresse von XY“ ordentlich unter Zuhilfenahme der Kontakte ausführt, scheitern Google und Cortana bei diesem Auftrag.

Besonders gut bei der Beantwortung von Sachfragen aller Art ist Google Now, hier macht sich die Google-Suchmaschine bemerkbar. Lässt sich eine Anfrage mittels Lexikon beantworten, wird die Antwort vorgelesen, sonst wird eine Auswahl an Webseiten vorgelegt. Selbst mathematische Aufgaben oder Umrechnungen erledigt Google per Sprachaufforderung zufriedenstellend. Auch Wetterberichte (Wie warm wird es?, Brauche ich einen Regenschirm?) oder die Suche nach Restaurants oder Supermärkte in der Nähe sind für keinen Probanden ein Problem. Selbst Fragen nach der Bundesliga-Platzierung des Lieblingsvereins werden unverzüglich beantwortet, Siri ist dabei besonders ausführlich.

WO ES NOCH HAPERT

Bei einigen Aufgaben wurden die Assistenten sogar bereits zum Mitdenken erzogen. Wird zuerst die Frage „Wie ist das Wetter in Berlin?“ gestellt, antworten alle drei Assistenten auch bei der Zusatzfrage „Und in Hamburg?“ richtig. Doch leider gilt das nicht generell. Zuerst eine Adresse heraussuchen und dann dorthin navigieren, funktioniert nur bei Siri zufriedenstellend. Ärgerlich ist auch, dass sich Apps zwar mit Sprachkommando öffnen lassen, weiterführende Aktionen wie das Herunterscrollen zum Beispiel von Twitter-Einträgen nur manuell funktionieren. Auch mit E-Mails haben die Probanden unerklärliche Probleme. Den Befehl „Lies neue E-Mails vor“ erledigt wiederum nur Siri wie gewünscht, Google und Cortana können mit dieser Aufforderung nichts anfangen und verweisen, wenn überhaupt, auf SMS-Nachrichten. Dafür gibt es dann nette Zusatzfunktionen. So wird auf Wunsch per Sprachaufforderung Musik abgespielt. Google durchsucht dabei den eigenen Musikbestand in der Cloud. Das iPhone greift auf die Musikbibliothek des Smartphones zurück. Cortana startet das MixRadio.

NICHT NUR FÜR MOBILE GERÄTE

Ihre Ursprünge hatte die Spracherkennung mit speziellen Programmen für Personal Computer. In erster Linie wurden sie als Diktierhilfen eingesetzt, als Zielgruppe für die anfangs recht teuren Programme galten beispielsweise Rechtsanwälte, aber auch für Ärzte wurden Bibliotheken mit entsprechenden Fachbegriffen herausgegeben. Aktuelle Windows-Computer beherrschen die Spracherkennung ebenfalls. Voraussetzung ist, dass der PC über ein Mikrofon verfügt, entweder wie bei Notebooks ein integriertes oder ein externes. Zur Aktivierung wird bei Windows in das Suchfeld „Spracherkennung“ eingetippt und in den Einstellungen der Schalter umgelegt. Mit der Windows-Spracherkennung lassen sich Texte diktieren, aber auch viele Funktionen des Betriebssystems oder von anderen Programmen lassen sich per Sprache steuern. Noch reagiert Windows jedoch nur auf vordefinierte Befehle. Das soll sich mit Windows 10 durch die Integration von Cortana ändern. Den Sprachassistenten von Google kann man schon jetzt auf dem Computer nutzen: vorausgesetzt auf dem PC oder Notebook ist der Chrome-Browser installiert und das System hat ein Mikrofon erkannt. Nach der Aktivierung können dann in allen Feldern, in denen das Mikrofon-Symbol zu sehen ist, die Texte per Sprache statt über Tastatur eingegeben werden.

FAZIT: ERSCHRECKEND AUFMERKSAM

Bei allen drei Systemen arbeitet die sprecherunabhängige Spracherkennung beinahe erschreckend gut. Zwar wird weiterhin betont, dass die Erkennung erst trainiert werden muss, doch in unserem Test gab es auf der Erfassungsebene so gut wie keine Missverständnisse. Insgesamt schnitt Apple in unserem Test zwar etwas besser ab, aber auch Google Now und Cortana gehorchen in den Lebenslagen, für die sie vorbereitet wurden, fast immer aufs Wort. Die Assistenten sind dabei so gut, dass man sich als Nutzer über den insgesamt noch stark beschränkten Funktionsumfang wundert. Sobald es komplizierter wird, wird im Auto dann doch der Beifahrer benötigt. Oder man muss rechts rausfahren, um das Smartphone in die Hand zu nehmen. Zumindest jetzt noch.

Glossar: So arbeiten die Helfer

Apple hat den Namen Siri gut gewählt. Er steht für „Speech Interpretation and Recognition Interface“, also übersetzt für die Erkennung und Verarbeitung von Anweisungen in natürlicher Sprache. Hierbei werden keine vordefinierten Sprachbefehle umgesetzt. Vielmehr wird dem Smartphonenutzer ein Assistent zur Seite gestellt, der Fragen aus dem Zusammenhang heraus versteht und entsprechend beantwortet.

Beim Namen von Microsofts Assistenten handelt es sich zwar nicht um ein Akronym, doch auch Cortana erklärt sich über seine Funktion. Der Name stammt aus dem Videospiel Halo, Cortana ist darin eine künstliche Intelligenz, die den Spieler unterstützt. Dies erfordert neben ausgeklügelter Software aber auch mehr Rechenkapazität, als ein Smartphone derzeit hergibt. Ohne Internet läuft darum bei Siri, Google und Cortana nichts. Die Kommandos und Fragen werden über eine verschlüsselte Verbindung an spezielle Server gesendet, dort erkannt und interpretiert, um die Antworten wieder an das Smartphone oder Tablet zu senden.

Damit die Assistenten keine Interna aus Nachrichten oder Terminen ausplaudern, sollten sie übrigens so eingestellt sein, dass die Dienste im Sperrbildschirm-Modus deaktiviert sind. sag

Autor

1 Kommentar

Neuester Kommentar
      Kommentar schreiben