Es sind nur drei Worte: "Hat Deutschland gewonnen?" Did Germany win? Der Mann, der sie in sein Smartphone spricht, sitzt in einem Konferenzraum in Kalifornien. Weit weg vom Fußballfieber im Old Europe. Die weibliche Stimme aus seinem Smartphone antwortet umgehend und korrekt: "Ja, Deutschland hat gegen Italien nach Elfmeterschießen 6:5 gewonnen." Wie konnte sie wissen, dass die Europameisterschaft in Frankreich gemeint war? Der Mann im Silicon Valley hätte ja auch von einem anderen sportlichen oder gar einem historischen Ereignis reden können.

Wir sind zum Gespräch mit Google-Manager Ben Gomes verabredet, Vizepräsident des Unternehmens und zuständig für die Weiterentwicklung der Suchmaschine. Aber ist Google überhaupt noch eine "Such"-Maschine? Mit dem Scrollen durch endlose Linklisten hat die heutige Nutzung mitunter kaum noch etwas gemein. Wer mündlich googelt, erhält mündliche Repliken, wer tippt, bekommt übersichtlich gestaltete Infoseiten angezeigt. Antworten statt Links. Selten genug muss man noch etwas anklicken und den Google-Kosmos verlassen.

Die schrittweisen Veränderungen an der Oberfläche gehen mit einem grundlegenden Strategiewandel im Unternehmen einher. Auf der jährlichen Entwicklerkonferenz I/O verkündete Google-CEO Sundar Pichai vor Kurzem: "Es reicht nicht, dass wir den Nutzern einfach nur Links geben. Wir müssen ihnen helfen, Dinge in der echten Welt erledigt zu bekommen." Google will nicht mehr passive Suchmaschine sein, sondern ein willfähriger Helfer für jede Lebenslage – der selbstverständlich auch sprechen kann. "Wir wollen eine natürliche Konversation ermöglichen", sagt Gomes.

Das Ziel: Die Nutzer sollen spontan und situativ jede erdenkliche Frage und Aufgabe per Spracheingabe an die sie umgebenden Geräte delegieren können. Intelligente Integration könnte man das nennen: Die alte Suchmaschine verschwindet dezent im Hintergrund, bleibt dort aber präsent. Ein beschwingtes "Ok Google" in die Luft gesprochen genügt, um den Dialog zum Beispiel im neuen Google-Messenger Allo oder mit der Google-Home-Lautsprecherstation zu beginnen. Beide sollen Ende 2016 auf den Markt kommen. Nutzer können sich dann – so suggerieren es Googles Werbespots – Restaurants oder Kinofilme vorschlagen lassen, Termine verwalten, Nachrichten verschicken oder thematische Dossiers zusammenstellen lassen.

Das erhöht einerseits den Komfort, wirft aber andererseits viele Fragen auf. Zunächst die nach dem Datenschutz. Hört Google in Zukunft immer überall mit – um leise lauschend noch mehr über den jeweiligen Kontext zu erfahren, in dem ein Nutzer sich bewegt? Gomes verneint. In Allo werde man die Such- und Empfehlungsfunktion erst aktivieren müssen, bevor Google sich in Chats einmischt. Und die Verbindung von Google Home zu Googles Servern ruht solange, bis die Worte "Ok Google" fallen. Sie werden nur lokal, also auf dem Gerät registriert. Ab dann sind Mikrofon und Lautsprecher allerdings aktiv und mit dem Suchmaschinen-Mutterschiff in Kontakt. Erst wenn die Stimmen im Raum verstummen, schaltet Google Home wieder auf Schlafmodus um. "Wir machen transparent, welche Informationen die Nutzer mit Google teilen", sagt Gomes. Auch im Fall der Sprachsteuerung werde es möglich sein, nachträglich Suchverläufe zu bereinigen oder ganz zu löschen. So wie das jetzt auch mit geschriebenen Suchanfragen geht.

Wo bleiben die Quellenangaben der Antwortmaschine?

Google-Vizepräsident Ben Gomes © ERIC PIERMONT/AFP/Getty Images

Vorausgesetzt, die Masse der Nutzer macht überhaupt Gebrauch von der Sprachbedienung: Reduziert die sprechende Such- beziehungsweise Antwortmaschine nicht die Komplexität von Wissen und Welt? Oder anders gefragt: Müssen die Nutzer künftig einfach glauben, was Google ihnen als kurze mündliche Antwort liefert? Vor allem, wenn ein kritischer Blick auf Quellenangaben oder weiterführende Linklisten – beispielsweise bei der Sprachausgabe im Auto oder bei Google Home – kaum noch möglich ist? Und wie können Nutzer dann noch zwischen neutralen Informationen und bezahlten Empfehlungen unterscheiden?

Die Sprachausgabe funktioniert ähnlich wie der mit "Auf gut Glück!" beschriftete Button der heutigen Suchmaschine: Wer ihn benutzt, landet nach der Eingabe seiner Suchbegriffe direkt auf dem obersten Ergebnis der Google-Suche, ohne Umweg über die Linkliste. Ob diese Liste etwas enthält, das möglicherweise besser zur konkreten Frage gepasst hätte, sieht der Nutzer nicht. Im Fall der Sprachausgabe bekommt er eine Antwort, ohne die Quelle oder alternative Quellen zu kennen. Die sieht er nur, wenn er noch mal auf dem jeweiligen Bildschirm nachschaut. Dort listet Google weiterhin Links auf.

Und sollte sich die verbale Auf-gut-Glück-Interaktion durchsetzen, muss Google auch ökonomisch umbauen. Denn wie will das Unternehmen, das bislang sehr gewinnbringend Werbeflächen in Linklisten versteigert hat, sein Geld verdienen, wenn Textanzeigen nebensächlich werden, weil die Suche über den Browser höchstens noch für akademische Tiefenrecherchen benötigt wird?

Google hat anderen Webseiten Traffic gebracht, das war lange das zentrale Geschäftsmodell. Im gerade von Microsoft-CEO Satya Nadella ausgerufenen Zeitalter der conversation as an interface könnte diese Säule bröckeln. Wo tun sich dann neue Märkte auf? Ben Gomes weicht der Frage nach Monetarisierungsstrategien für den Sprachassistenten aus: "Wir wollen einen Mehrwert für den Nutzer schaffen, darum geht es uns in erster Linie. Andere Formen von Mehrwert werden folgen. Wir stehen ohnehin erst ganz am Anfang." 

Jede zweite Suche über Smartphones, davon 20 Prozent gesprochen

Dass über Vermarktung noch nicht nachgedacht wird, scheint wenig glaubwürdig. Immerhin sind sich in Silicon Valley derzeit alle einig, dass die mündliche Interaktion dieKommunikationsform der Zukunft ist. Alle setzen auf Chatbots, neben Google und Microsoft auch Facebook und Apple. Die gelungene Simulation einer menschlichen Unterhaltung wird den Ausschlag geben, ob Kunden sich kurzfristig zufriedenstellen und langfristig binden lassen.

Mittlerweile verarbeitet Google vier Milliarden Suchanfragen täglich. Davon kommen nach Aussage von Google rund 50 Prozent von Smartphones. Von diesen Anfragen werden wiederum 20 Prozent per Spracheingabe ausgelöst. Und das ist erst der Anfang. "Die Zuwächse bei der Spracheingabe sind riesig", sagt Gomes.