SpracherkennungVerständnisvolle Geräte

Die Maschinen werden menschlicher. Autos, Fernseher und Kaffeemaschinen werden demnächst verstehen, was wir ihnen sagen, und unsere Befehle ausführen. Das macht das Leben einfacher – und birgt womöglich Gefahren. von Ulf Schönert

Schlagfertig ist die Dame. Den Hamburger Gruß "Moin, Moin" kontert Siri mit dem Hinweis: "Hallo. Du weißt, dass es bereits 19.32 Uhr ist, nicht wahr?" Und auch sonst ist die virtuelle Assistentin, die auf allen neuen iPhones installiert ist , nicht auf den Mund gefallen. "Ich, Siri, wurde von Apple in Kalifornien entwickelt", stellt sie sich beim ersten Einschalten vor. "Was machst du so?", ist man geneigt zu fragen, und tut man es, antwortet die Telefonstimme: "Was ich mache? Ich spreche mit dir." Nie ließ ein technisches Gerät seinen Besitzer so dämlich aussehen – und sich selbst damit umso schlauer.

Seit ein paar Monaten ist Siri auf dem Markt und tut schon auf Millionen iPhones ihren Dienst. Sie ist eine Sekretärin, die Diktate aufnimmt, Termine verwaltet, Musik anmacht und E-Mails raussucht. Aber auch eine persönliche Assistentin für den Alltag. "Brauche ich heute einen Regenschirm?", kann man sie fragen. "Nein, heute scheint den ganzen Tag die Sonne", antwortet Siri dann zum Beispiel. Und sorgt mit solch ganz alltäglichen Hilfsdiensten dafür, dass sich bei Handynutzern eine neue Bedienweise etabliert: Die Leute beginnen, mit ihren elektronischen Geräten zu reden.

Anzeige

Bewirkt hat dies der US-Spracherkennungsspezialist Nuance . Seine Technologie steckt hinter Siris Sprachvermögen. Und auch Hunderte andere elektronische Geräte, die entweder schon sprechen können oder es gerade lernen, greifen auf die Spracherkennung von Nuance zurück: Navis, PCs, Autos. Obendrein gehören die auf fast jedem Handy installierten Eingabemethoden T9 und Swype zu Nuance. So wurde das Unternehmen mit Hauptsitz in Massachusetts vom Nischenprodukthersteller zum Milliardenkonzern mit weltweit 7.000 Mitarbeitern, die mehr als 70 Sprachen betreuen.

Die Deutschland-Niederlassung liegt in einem Gewerbegebiet außerhalb von Aachen . Wer zu Besuch kommt und einen Kaffee trinken möchte, bestellt ihn nicht bei seinem Gastgeber, sondern direkt bei der Kaffeemaschine, die auf dem Empfangstresen steht. Der Befehl "Kaffee schwarz" wird ebenso fehlerfrei und prompt umgesetzt wie "Latte Macchiato".

Eine weitere Anwendung der Technologie führt Martin Held in seinem Büro vor. "Durchsuche Wikipedia nach ›Spracherkennung‹", sagt Held, der bei Nuance für die Diktiersoftware Dragon Naturally Speaking zuständig ist. Der Computer gehorcht. Ein Browser öffnet sich, darin die deutschsprachige Wikipedia-Seite. Wie von Zauberhand ist das Suchwort "Spracherkennung" schon eingegeben, und der Lexikonartikel erscheint. "Mit unserer Software können Sie inzwischen jeden Computer komplett freihändig steuern", sagt Held. Konzipiert wurde Dragon Naturally Speaking als Diktierhilfe für Vielschreiber und Büroangestellte. Einem Millionenpublikum ist das Programm durch den Abkömmling Dragon Dictation bekannt, eine kostenlose App, mit der man seinem Handytexte diktieren kann und das inzwischen auf zahllosen iPhones läuft.

Sogar das klassische Terrain der Fernbedienung erobert die Sprachtechnologie – die Fernsehsteuerung. Auf Englisch funktioniert es schon: "Switch to CNN" , sagt Raimund Schmald, bei Nuance Experte für den Einsatz von Sprachtechnologie im Wohnzimmer. Der Fernseher schaltet auf CNN um. Aber hat das Sinn? Ist der Druck auf die Fernbedienung nicht schneller und praktischer? Das gibt Schmald gern zu. Um dann sogleich zu zeigen, wofür die Technologie wirklich gut ist: etwa um einen Festplattenrekorder zu programmieren. Anstatt mit den Pfeiltasten der Fernbedienung mühsam Buchstaben auf einer Bildschirmtastatur auszuwählen, muss Schmald nur noch einen Satz laut sagen: "Search movies with Cameron Diaz" – und schon erscheint eine entsprechende Trefferliste, zusammengestellt aus dem aktuellen Fernsehprogramm. Er muss nur noch einen Film auswählen, schon ist der Timer programmiert.

Vieles spricht dafür, dass 2012 das Jahr des Durchbruchs für die Sprachbedienung wird. Gerade hat LG eine TV-Fernbedienung vorgestellt , die mit einem Mikrofon ausgestattet ist, in das man Suchbegriffe sprechen kann. Die Telekom arbeitet an einer Sprachsteuerung für ihr "Entertain"-System. Samsung und Lenovo stellten auf der Consumer Electronics Show in Las Vegas Fernseher vor, die sich mit Handzeichen und Sprachbefehlen bedienen lassen , Intel arbeitet an entsprechenden Notebooks . "Das Thema Spracherkennung hat eine große Zukunft", glaubt Alexander Hengesbach vom Marktforschungsunternehmen Sirvaluse, das auf die Bedienbarkeit von technischen Geräten spezialisiert ist. "Viele Abläufe lassen sich so radikal vereinfachen. Darin steckt enormes Potenzial."

Leserkommentare
  1. aussehen.

    Das Stimmt.
    Siri, ich hätte gerne Schokokekse.
    Schokokekse nicht im Adressbuch gefunden... Das nenn ich mal Intelligenz, die mich sprachlos macht.

    Apropos Sprachlos: Ohne und auch bei schlechtem Empfang, oder ausgelastetem Netz, bleibt Siri sprachlos. Maulfaules Ding...

    3 Leserempfehlungen
    • PigDog
    • 15. März 2012 13:26 Uhr

    Mit SIRI habe ich noch nicht geredet, aber dafür gerade gestern mal wieder mit dem Computer vom Telekom-Service.

    Wie immer ein ziemlich deprimierender Voprgang. Mit etwas zu kommunizieren dessen Intelligenz nur unwesentlich über der eines überfahrenen Igel's liegt macht wenig Freude!

    Und so lange DAS der durchschnittliche Stand der Technik ist, wird auch eine noch so schlagfertige und witzige SIRI bei'm Durchschnitts-Otto-Normalverbraucher Begeisterungsstürme auslösen...

    3 Leserempfehlungen
    Reaktionen auf diesen Kommentar anzeigen
    • PigDog
    • 15. März 2012 13:28 Uhr

    KEINE Begeisterungsstürme auslösen...

    muss es natürlich heißen.

    • PigDog
    • 15. März 2012 13:28 Uhr

    KEINE Begeisterungsstürme auslösen...

    muss es natürlich heißen.

    Antwort auf "Sprechende Computer..."
    • JeWe
    • 15. März 2012 13:32 Uhr

    "Den Hamburger Gruß »Moin, Moin« kontert Siri mit dem Hinweis: »Hallo. Du weißt, dass es bereits 19.32 Uhr ist, nicht wahr?«"

    Peinlich nur für Siri, dass "Moin" aber auch so gar nichts mit dem Morgen zu tun hat.

    8 Leserempfehlungen
  2. ... ab hier:

    "Computer? Einen Raktajino bitte!" Zzzzzzz

    Solange ich meine Kaffeemaschine mit Wasser und Kaffee befüllen muß, ist der Knopfdruck schneller als gesprochene Sätze.

    6 Leserempfehlungen
  3. Vielen Dank für diesen Artikel,
    Es hat wirklich Spaß gemacht ihn zu lesen!

    Mehr davon!

  4. ... in kürzester Zeit wenn die Namen in meinem Adressbuch auch nur um Millimeter von Standardnamen wie Hans Müller oder John Smith abweichen.

    Angeblich soll es ja besser werden wenn man die Dame ordentlich einarbeitet. Aber wieso sollte ich da Zeit reinstecken?

    Eine Leserempfehlung
  5. Wie so oft hat Apple es einfach nur besser vermarktet als Windows. Schon bei Windows XP konnte man eine Sprachsteuerung anmachen Diese war zwar noch im Anfangsstadium aber es gab die Ansätze. Apple ist also auch nur ein Nachmacher, der es aber zu vermarkten weis. Schon das Tablet hatte Windows vor Apple und nur die haben es eben nicht vermarktet bekommen.

    Das mit dem Hamburger Gruß kann ich nur als peinlich bezeichnen.

    3 Leserempfehlungen

Bitte melden Sie sich an, um zu kommentieren

  • Artikel Auf einer Seite lesen
  • Schlagworte BMW | Telekom | Christian Süß | Lenovo | Technologie | Xbox
Service