Nach den schweren Ausschreitungen am Rande des G20-Gipfels im Juli 2017 hatte die Hamburger Polizei ein Problem: Nur wenige der Randalierer hatte sie noch beim Gipfel fassen können. In der Aufklärung setzen die Behörden deswegen nun auf Computerunterstützung. Mit einer Software werden Tausende Videos und Fotos des Gipfels automatisch ausgewertet. Hamburgs Datenschutzbeauftragter Johannes Caspar hat massive Bedenken – und die Löschung der Datenbank angeordnet. Doch die Polizei macht trotzdem weiter. Was nun?

ZEIT ONLINE: Herr Professor Caspar, Sie haben den Innensenator von Hamburg angewiesen, die Datenbank zu löschen, mit deren Hilfe gerade viele G20-Straftäter überführt werden. Warum?

Johannes Caspar: Die Polizei nutzt eine Software zur automatisierten Gesichtserkennung, um aus einer Masse von Bildern und Videos Straftäter zu identifizieren. Hierzu werden zunächst Video- und Bildaufnahmen von Personen erhoben. In einem zweiten Schritt werden aus dem gesammelten Material über die eingesetzte Software maschinenlesbare und abgleichbare Modelle von menschlichen Gesichtern unterschiedslos aller darauf abgebildeten Personen erzeugt. Dieser zweite Schritt ist das Problem. Durch die Erzeugung von Gesichts-IDs jeder Person entsteht eine polizeiliche biometrische Datenbank. Sie enthält Passanten, S-Bahn-Nutzer, Teilnehmer an Demonstrationen, also völlig unbeteiligte Personen, gegen die strafrechtlich nie etwas vorlag. Wir wissen nicht, wie viele Personen betroffen sind, aber wir vermuten, dass es in die Hunderttausende gehen könnte. Eine Rechtsgrundlage für die Herstellung beziehungsweise Sicherstellung von Video- und Bildmaterial existiert, das ist bekannte Polizeiarbeit. Anders für den zweiten wesentlich eingriffsintensiveren Schritt, die Erstellung einer biometrischen Massendatenbank. Hier überschreitet die Polizei in Hamburg ihre rechtlichen Kompetenzen, da eine Ermächtigungsgrundlage hierfür nicht besteht.

ZEIT ONLINE: Die Software erkennt also automatisch, wann ich an welcher Überwachungskamera vorbeigelaufen bin, und erstellt ein Bewegungsprofil, auch wenn ich an diesen Tagen nur normal zur Arbeit gegangen bin?

Caspar: Man kann mit der hier eingesetzten Software aus dem Datenpool herausfiltern, wer wann mit wem wo war. Beispielsweise, wer wann an einer Demonstration teilgenommen hat, aber auch, wer mit wem in eine Kneipe gegangen ist. Das revolutioniert die Polizeiarbeit bei der Fahndung nach Straftätern im öffentlichen Raum. Gleichzeitig eröffnet die automatisierte Gesichtserkennung eine nie da gewesene Kontrollmacht für staatliche Stellen, die im Besitz von Bildern sind. Selbst US-Konzerne wie Microsoft und Google haben dies erkannt und jüngst vor den Folgen des Einsatzes gewarnt.

ZEIT ONLINE: Theoretisch ließen sich dann Echtzeitbewegungsdaten von allen Bürgern anfertigen. Bisher werden aber nur Daten von Bildern beim G20-Gipfel ausgewertet, richtig?

Caspar: Das kann ich nicht sagen. Die Polizei hat ja bereits vor einiger Zeit angekündigt, das Verfahren der automatisierten Gesichtserkennung auch in anderen Bereichen einzusetzen. Es bestehen uns gegenüber keine Anzeige- oder Meldepflichten. Auch mit Blick auf das Datenmaterial, das im Zuge von G20 ausgewertet wurde, lassen sich eindeutige Zuordnungen des Bildmaterials häufig nicht treffen. Neben den polizeieigenen Aufnahmen von Ausschreitungen und Versammlungen stammen die Aufnahmen aus öffentlichen Verkehrsmitteln und aus den Medien, aber auch von privat aufgenommenen Videos, die auf einen Server des BKA hochgeladen werden konnten. Eine Prüfung, ob die privaten hochgeladenen Bilder mit G20 etwas zu tun hatten, erfolgte nur insoweit, als offenkundig irrelevante Aufnahmen, wie Pornos oder Katzenvideos, aussortiert wurden.

ZEIT ONLINE: Von wie vielen Bildern und Videos reden wir eigentlich?

Caspar: Die Polizei hat 100 Terabyte zur Auswertung gesichert, davon sind bislang Stand August 2018 17 Terabyte biometrisch verarbeitet worden – unseres Wissens circa 32.000 Video- und Fotodateien. Die Polizei selbst sagt, sie hätte ohne automatisierte Auswertung 60 Jahre gebraucht, um das Material überhaupt zu sichten.