Emotions-Erkennung Computer lernen Gefühle

An Stimme, Mimik und Pulsrate können Rechner erkennen, wie es ihren Nutzern geht. Für Forscher ein Weg, damit der Umgang mit Maschinen endlich Spaß macht.

Die freundliche Computerdame signalisiert gerne Zustimmung. Sie versteht kein Wort des Gesagten, reagiert aber auf die Tonlage

Die freundliche Computerdame signalisiert gerne Zustimmung. Sie versteht kein Wort des Gesagten, reagiert aber auf die Tonlage

Marc Schröder findet Maschinen nicht dumm, nicht faul, nicht laut, er findet sie vor allem – unhöflich. "Stellen Sie sich vor, Sie reden mit jemanden, und der antwortet einfach nicht. Nie! Er guckt Sie nicht mal an, und erklärt Ihnen auch nicht, dass er mit etwas anderem beschäftigt ist", sagt Schröder. Es klingt, als verwechsele der Experte für Künstliche Intelligenz da Mensch und Maschine.

Dabei ist das gar nicht so weit hergeholt: Schließlich schimpfen wir tatsächlich ständig mit unseren Rechnern. "Je komplexer ein Gerät, desto eher nehmen Menschen es als soziale Einheit wahr", sagt Schröder. Und beruft sich dabei auf das Buch: The Media Equation von Byron Reeves und Clifford Nass. Die beiden Standford Professoren konnten eindrucksvoll belegen, dass Menschen ihre elektronischen Medien oft wie Menschen behandeln.

Anzeige

"Es wird Zeit, dass Maschinen lernen, den Menschen besser zu verstehen", findet auch Christian Peter vom Fraunhofer Institut in Rostock. Vor allem, da die Maschinen immer komplexer würden und dabei von Menschen bedient werden sollen, die weder mit einem iPhone noch mit einem elektronischen Taschenrechner groß geworden sind.

Gucken, was Oma so treibt: Rechts können die Angehörigen Fotos hochladen. Der Smiley zeigt an, ob es der Oma gut geht. Außerdem gibt es Statusmeldungen wie auf Twitter, ein Aktivitätsprotokoll und den aktuellen Bewegungsstatus

Gucken, was Oma so treibt: Rechts können die Angehörigen Fotos hochladen. Der Smiley zeigt an, ob es der Oma gut geht. Außerdem gibt es Statusmeldungen wie auf Twitter, ein Aktivitätsprotokoll und den aktuellen Bewegungsstatus

Auf der Cebit stellt das Fraunhofer Institut derzeit ein System vor, das sich an älteren Menschen richtet: Diatrace registriert den Gefühls- und Aktivitätszustand einer Person und kommuniziert ihn ins Netz. Wie auf einem Sozialen Netzwerk wie Facebook können Angehörige Kontakt halten und in Echtzeit mitbekommen, ob es den entfernt wohnenden Großeltern gerade gut geht, ob sie sich ausreichend bewegen oder ob sie ganz dringend besucht werden müssen – zu erkennen etwa an dem Smiley auf der Seite, der irgendwann aufhört zu lächeln.

Peter fallen eine ganze Reihe möglicher Einsatzgebiete für fühlende Computer ein: Systeme zur automatischen Spracherkennung bei Telefon-Hotlines wären vermutlich eine geringere Qual, wenn sie den Ärger eines Anrufers bemerken und darauf reagieren könnten, statt in ihrem monotonen Singsang fortzufahren. Oder Computerspiele: Sie könnten sich auf das Befinden eines Spielers einstellen und ein Spiel individuell weniger ängstigend oder sogar noch blutrünstiger machen, je nachdem, wie dem Menschen am anderen Ende der Grafikkarte gerade zumute ist. "Voraussetzung für solche Anwendungen ist natürlich, dass der Computer lernt, Emotionen zu verstehen", sagt Peter.

Das kann ein System auf mehrfache Weise. Die emotionale Spracherkennung, an der Peters Institut derzeit arbeitet, kann zum Beispiel sieben Gemütszustände an der Stimme erkennen: Freude, Ekel, Ärger, Trauer, Angst, Überraschung und Gleichmut. Dazu hat der Stimmanalysator vorher in etlichen Sitzungen gelernt, die relevanten Merkmale im Stimmspektrum zu identifizieren: Zittert die Stimme, verändern sich Lage, Höhe und Lautstärke? Passiert das alles eher schnell oder langsam? Bis zu 2000 verschiedene Merkmale wertet das System so aus. "Die Trefferquote für die sieben Gemütszustände liegt bei 70 Prozent", sagt Peter. Menschen gelänge das kaum besser.

Und wie beim Menschen funktioniert das besonders gut, wenn mehrere Informationen gleichzeitig zur Verfügung stehen: So liest der Mensch auch im Gesicht des Gegenüber. Dementsprechend lernt der Rechner, die Bewegungen von Augenbrauen, Lippen, Mundwinkeln und ein leichtes Beben der Nasenflügel zu bewerten. Menschen bemerken aber auch, ob sich beim Gesprächspartner der Puls beschleunigt, ob die Hauttemperatur steigt oder er gar feuchte Hände bekommt. Für den Rechner übernimmt diese Messung ein Datenhandschuh.

"Und dann sind zum Beispiel Testfahrten für Marktforscher doppelt wertvoll", sagt Peter. Weil sie die wahre Haltung zum neuen Turbo-Auto ans Licht bringen: Bei Befragungen sind Menschen nämlich häufig zu freundlich, um zu sagen, dass ihnen die Kurvenlage überhaupt nicht gefallen hat oder sie sich beim Bremsen deutlich unsicher gefühlt haben. Oder sie sind um Selbstdarstellung bemüht und werten etwas ab, weil sie glauben, andere könnten es uncool finden.

Peter hofft, dass er mit diesem Lügendetektor-Argument Kunden für seine technischen Lösungen findet. Denn selbst wenn Computer schon viel über Gefühle gelernt haben – noch mangelt es an marktreifen Anwendungen. Bei Telefon-Hotlines hapert es nicht zuletzt am Datenschutz: So dürfen Kundengespräche normalerweise nur vom Teamleiter eines Unternehmens mitgehört werden, und auch nur dann, wenn der Kunde dem zuvor zugestimmt hat.

Schröder sieht die besten Anwendungsmöglichkeiten derzeit noch im Unterhaltungsbereich. "Hier ist das Risiko nicht groß, wenn die Maschine doch noch etwas falsch versteht", sagt er. Und glaubt: "Bis der kommerzielle Erfolg kommt, müssen wir noch besser werden."

Schröder kann immerhin schon einen verdammt höflichen Gesprächspartner präsentieren: Poppy ist ein sogenannter "Sensitive Artificial Listener", ein Zuhörer. Zwar versteht Poppy inhaltlich kein Wort. Die Pixeldame reagiert jedoch auf die Tonlage ihres monologisierenden Gesprächspartners, indem sie zustimmend nickt, gelegentlich erstaunt die Augenbrauen hebt oder beeindruckt nachfragt. Für viele mag das schon heute ein echtes Kaufargument sein. Gibt es doch genug Menschen, die ohnehin am liebsten sich selbst beim Reden zuhören.

 
Leser-Kommentare
  1. Dann wird man künftig noch mehr Menschen (die oft auch schon halbe Maschinen sind) durch Maschinen ersetzen.
    Das setzt doch phantastisch viele Arbeitskräfte frei, die dann viel wichtigere Arbeit tun können. Es sei denn, sie wollen nicht, sie wollen "anstrengungslos" Sozialhilfe kassieren.
    Wahrscheinlich wird man in zehn, zwanzig Jahren auch keine Mütter und Väter mehr brauchen, denn Rechenmaschinen können das alles viel besser.
    Und die überflüssig gewordenen Eltern können dann den ganzen Tag lang eintauchen in die Erlebniswelt unendlichen Spaßes.

    Reaktionen auf diesen Kommentar anzeigen

    Stellen sie sich mal vor, in 20 Jahren übernehmen solche Maschinen alle Arbeit (varausgesetzt, sie übernehmen nicht vorher die Weltherrschaft ;)), und finanzieren uns alle unsere süätrömische Dekadenz. Wäre das nicht mal ein Weg, das alles positiver zu sehen?

    Stellen sie sich mal vor, in 20 Jahren übernehmen solche Maschinen alle Arbeit (varausgesetzt, sie übernehmen nicht vorher die Weltherrschaft ;)), und finanzieren uns alle unsere süätrömische Dekadenz. Wäre das nicht mal ein Weg, das alles positiver zu sehen?

  2. Stellen sie sich mal vor, in 20 Jahren übernehmen solche Maschinen alle Arbeit (varausgesetzt, sie übernehmen nicht vorher die Weltherrschaft ;)), und finanzieren uns alle unsere süätrömische Dekadenz. Wäre das nicht mal ein Weg, das alles positiver zu sehen?

    Antwort auf "Ist doch suuuper !!!"
  3. Die Unemotionalität z.B. von Navis fand ich immer einen der grössten Vorteile. Statt Beleidigigt zu sein, berechnet es einfach einen neuen Kurs.

Bitte melden Sie sich an, um zu kommentieren

Service