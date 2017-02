Inhalt Seite 1 — Google Brain erschafft Porträts aus ein paar Pixeln Seite 2 — Halluzinierende Software Auf einer Seite lesen

Google Brain lässt wieder einmal künstliche Intelligenzen (KI) halluzinieren. Dieses Mal geht es nicht darum, fantastische Kreaturen in Bildern zu erkennen, wo keine sind. Sondern darum, realistische Details in Bilder hineinzuinterpretieren, wo es keine gibt. Aus bloß acht mal acht Pixeln machen die Forscher der KI-Abteilung im Mutterkonzern Alphabet zum Teil erstaunlich echt wirkende Bilder, selbst von menschlichen Gesichtern.



Wie erstaunlich, zeigen die folgenden Beispiele.

Die linke Spalte zeigt drei auf jeweils acht mal acht, also auf 64 Pixel heruntergerechnete Bilder von Prominenten aus einer Datenbank, die rund 200.000 Fotos enthält. In der Mitte ist zu sehen, was passiert, wenn Googles KI aus diesen 64 Pixeln neue Bilder mit 32 mal 32 Pixeln machen. In der rechten Spalte stehen zum Vergleich die Originalfotos, ebenfalls heruntergerechnet auf 32 mal 32-Pixel.

Es ist nicht so, dass sich die Bilder der mittleren und der rechten Spalte allesamt zum Verwechseln ähnlich sehen. Aber doch so ähnlich, dass eine Beschreibung dessen, was darauf zu sehen ist, auf beide Versionen zuträfe. Die Google-Forscher vergleichen ihre KI mit einem Künstler, der auf der Grundlage eines sehr grob aufgelösten Gesichtsfotos ein glaubwürdig erscheinendes Bild malen kann, weil er aus Erfahrung weiß, wie Gesichter eben aussehen. Um diesen Effekt zu erreichen, setzen die Forscher zwei künstliche neuronale Netzwerke ein. (Die Geschichte und Funktionsweise solcher Netzwerke erklären wir hier ausführlich.)



Das erste Netzwerk vergleicht die 64-Pixel-Bilder mit anderen Bildern, die ebenfalls auf 64 Pixel verkleinert werden, und sucht dann nach Übereinstimmungen. So soll es herausfinden, was sein Ausgangsbild zeigt – also zum Beispiel ein Gesicht oder ein Zimmer.

Das zweite, mit hochauflösenden Bildern trainierte Netzwerk versucht dann, das 64 Pixel kleine Ausgangsbild zu extrapolieren, indem es Pixel hinzufügt, die typischerweise in einem Foto eines Gesichts oder eines Zimmers enthalten sind.



Testpersonen hielten computergenerierte Bilder für echt

Kurz erklärt - Was ist künstliche Intelligenz? Humanoide Roboter, eine Matrix, die Menschen als Energiespender benutzt – so stellen wir Menschen künstliche Intelligenz in Filmen dar. Doch wie sieht die Wirklichkeit aus? © Foto: Zeit Online

Das erste Netzwerk, schreiben die Forscher in ihrem Paper zur Pixel Recursive Super Resolution genannten Methode, "bringt uns schon ziemlich weit beim Versuch, ein höher aufgelöstes Bild vorherzusagen. Doch an Stellen, an denen es sich unsicher ist, bleibt das Bild unscharf." Erst wenn man die Ergebnisse beider Netzwerke kombiniere, erhalte man klar erkennbare Bilder.

"Vorhersagen" ist dabei das Schlüsselwort. An der Stelle könnte auch "ausdenken" oder "herbeifantasieren" stehen. Denn die neuronalen Netzwerke können die Originalversionen der Fotos nicht einfach aus den 64 Pixeln zurückrechnen, dafür gehen bei der Interpolation vom hochaufgelösten Datenbankmaterial auf erst 32 mal 32 und schließlich auf acht mal acht Pixel viel zu viele Informationen verloren. Das bedeutet: Aus 64 Pixeln könnte ein Netzwerk, selbst wenn es das hochaufgelöste Original kennt, viele recht verschiedene Motive erzeugen, es hat sozusagen einen großen Interpretationsspielraum.