Bilderkennung War das ein Tiger?

Computer können jetzt binnen weniger Bruchteile von Sekunden Bilder erkennen - wie Menschen. Der Clou ist, dass die Rechner auch die gleichen Fehler machen.

Wir wissen zwar nicht, wie wir es hinkriegen - aber wir tun es pausenlos: Im Bruchteil einer Sekunde erkennt der Mensch, was er vor Augen hat. Und das kann er selbst dann noch, wenn das, was er sieht - das Objekt - halb verdeckt ist oder auf dem Kopf steht. Wie unser Gehirn diese Aufgabe löst, ist noch nicht vollständig geklärt. Nur höhere Affen können Vergleichbares leisten. Hochleistungscomputer dagegen schaffen das bis heute nicht.

Aber Rechner könnten immerhin von uns lernen - und dann helfen zu verstehen, wie unser Gehirn in so kurzer Zeit komplexe Bilderkennungsaufgaben löst. An einem Computer haben Forscher vom Massachusetts Institute of Technology (MIT) jetzt für den ersten, nur wenige Millisekunden dauernden Blick die Signalverarbeitung simuliert. "Dass es so gut funktionieren würde, war eine Überraschung", sagt Hirnforscher Tomaso Poggio. "Möglicherweise sind wir an einem Punkt angekommen, an dem die Neurowissenschaft der Computerwissenschaft etwas beibringen kann."

Anzeige

Menschen sind zum Beispiel innerhalb von Millisekunden in der Lage zu erkennen, ob sich in einer Szene vor ihren Augen ein Tier befindet. Dass diese Fähigkeit bei uns so gut entwickelt ist, liegt vermutlich daran, dass der winzige erste Moment für unsere Vorfahren in der Wildnis über Leben und Tod entschied. Gehören die gelbschwarzen Streifen hinterm Busch womöglich zu einem Tiger? Ist das zusammengerollte längliche Etwas am Wegesrand eine Schlange? Wer sich erst einmal solche Fragen stellte, verpasste seine Chance zur Flucht. Und wurde gefressen oder gebissen.

Für die erste Einordnung reicht schon ein Augenblick von 20 Millisekunden. Diese Zeitspanne wäre allerdings viel zu kurz, um ein Tier oder ein anderes Objekt bewusst wahrzunehmen. Die Bilder eines Kinofilms etwa sind doppelt so lange zu sehen, ohne dass wir sie einzeln erkennen. Und Testpersonen, die für 20 Millisekunden ein Bild gezeigt bekommen, können normalerweise nicht konkret sagen, was sie da gesehen haben. Mit der Einschätzung, dass es sich um ein Tier gehandelt habe, liegen sie trotzdem fast immer richtig.

Forscher vermuten deshalb schon lange, dass es sich bei dieser ungeheuer schnellen Kategorisierung um einen sogenannten Feedforward-Prozess handelt: Die Informationen laufen nur in eine Richtung, und zwar von den einfachsten Zellknoten stufenweise in die Bereiche des Gehirns, in denen die komplexe Verarbeitung stattfindet. Umgekehrt - von komplex nach einfach - fließen dagegen keine Informationen. Die Anweisung, noch mal genauer hinzuschauen, wäre so ein Rücklauf, ein Feedback. Würde unser Gehirn Feedback-Prozesse mit in die Kategorisierung einbinden, dauerte der Vorgang der Bilderkennung deutlich länger.

Was man heute über die Bilderkennung des Menschen weiß, stammt zu großen Teilen aus Tests an Affen: Forscher messen dazu die Aktivität der Hirnzellen während der Verarbeitung von optischen Eindrücken. Die daraus gewonnenen Erkenntnisse haben Poggio und seine Kollegen in ihrem Computersystem umgesetzt. Es arbeitet mit hierarchisch organisierten Ebenen, die einander abwechseln.

Schreiben Sie den ersten Kommentar!

    Bitte melden Sie sich an, um zu kommentieren

    • Seite 1 | 2 | Auf einer Seite lesen
    • Quelle ZEIT online
    • Versenden E-Mail verschicken
    • Empfehlen Facebook, Twitter, Google+
    • Artikel Drucken Druckversion | PDF
    • Schlagworte MIT | Gehirn | Tier | Computer | Affe
    • Artikel-Tools präsentiert von:

    Service