Hurrikan Sandy hat vor vier Jahren unzweifelhaft große Schäden an der US-Ostküste angerichtet – aber die U-Bahn-Station am Times Square in New York hat er nicht in ein Taucherbecken verwandelt. Er hat auch keine Haie in die Straßen von New Jerseys Städten gespült, auch wenn spektakuläre Fotos das nahelegten. Sie waren mit Photoshop gefälscht, sahen aber täuschend echt aus. Adobes mächtiges Bildbearbeitungsprogramm eignet sich gut für so etwas. So gut, dass Menschen und Medien immer wieder darauf hereinfallen. Nun entwickelt das Unternehmen ein ähnliches Werkzeug für Audiodateien.

Project VoCo heißt der Prototyp des Audio-Editors, den Adobe auf der Hausmesse MAX in San Diego präsentiert hat. Ob er jemals als eigenständiges oder Teil eines anderen Produktes auf den Markt kommt, ist ungewiss.

Aus technischer Sicht ist VoCo jedenfalls durchaus faszinierend: Die Software lässt sich mit Stimmaufnahmen trainieren und kann anschließend die jeweilige Stimme nachahmen und sie auch Wörter sagen lassen, die im Trainingsmaterial gar nicht vorkommen. Eine 20-minütige Aufnahme einer Stimme genügt, heißt es in Berichten von TechCrunch undder Neuen Zürcher Zeitung (NZZ), die bei der Pressevorführung anwesend waren. Anschließend tippt man in ein Eingabefeld, was die Stimme sagen soll. Noch könne man, wenn man genau hinhört, die künstlich modulierten Wörter heraushören, heißt es bei TechCrunch, aber früher oder später dürfte das kaum noch möglich sein. Dieses kurze Video zeigt Teile der Präsentation.

Merkel sagen lassen: "Ich glaube, wir schaffen das doch nicht"

Für Hörbuch- und Podcastproduzenten wäre VoCo nützlich. Sie könnten vernuschelte oder sonst wie misslungene Teile von Aufnahmen nachträglich aufpolieren, ohne die Sprecher noch einmal ins Studio holen zu müssen.

Aber so wie Photoshop für Bildmanipulationen genutzt wird, könnte auch VoCo missbraucht werden. Nachrichtensendungen oder Politikerstatements zu fälschen, dürfte zum Beispiel kein Problem sein. Mit gängigen Schnittprogrammen lassen sich Aussagen und Wörter eines Menschen ohnehin schon neu kombinieren. VoCo wäre zusätzlich so etwas wie ein elektronischer Stimmenimitator. Noch wirkungsvoller wäre die Kombination von Audio und Videoaufnahmen mit gefälschter Mimik und Gestik – auch dafür gibt es schon experimentelle Software.

Adobe-Entwickler wissen natürlich um solche Gefahren. Auf der Konferenz versicherte einer der Entwickler nach Angaben der NZZ, dass Adobe "akustische Wasserzeichen" in die von VoCo erzeugten Schnipsel einbauen wolle. Mit deren Hilfe sollen sich Fälschungen erkennen lassen. Selbst wenn das dauerhaft funktionieren sollte: So wie es immer Menschen geben wird, die auf manipulierte Fotos hereinfallen, wird es auch solche geben, die erst einmal glauben, was sie hören.