Offiziell nennt er sich Completely Automated Public Turing Test to Tell Computers and Humans Apart, kurz Captcha. Doch für viele ist der Test, der Menschen von Software unterscheiden soll, schlicht die Pestbeule des Internets. Captchas, das sind die kleinen Checkboxen auf Websites, in denen Nutzer meist krakelige Schriftzeichen erkennen müssen, um als Mensch und nicht als Spambot durchzugehen. Ob zur Registrierung, zur Verifizierung oder um auf Dateien bei Speicherdiensten zuzugreifen – Captchas sind allgegenwärtig.

Das soll sich ändern, wenn es nach Google geht. In einem Blogbeitrag kündigt das Unternehmen an, die unkenntlichen Zeichenfolgen hätten ausgedient. Googles Alternative trägt den hölzernen Namen No Captcha ReCaptcha und besteht aus einer einzelnen Checkbox. In dieser müssen die Nutzer lediglich einen Haken setzen und bestätigen: "Ich bin kein Roboter." Keine Hieroglyphen mehr, keine Rätsel. Googles Datensammlung sei Dank. Die Erfolgsquote soll laut Google bei bis zu 80 Prozent liegen. Nur wenn sich das System nicht sicher ist, erscheinen zusätzlich die bekannten Captchas.

Ursprünglich waren Captchas dazu gedacht, die Sicherheit der Nutzer und Dienste im Netz zu schützen. Als ein Team von Altavista im Jahr 1997 erstmals Captchas einsetzte, geschah das, um Bots daran zu hindern, Spam-Websites in die Suchmaschine einzutragen. Den Begriff Captcha erfand der damalige Informatik-Student Luis von Ahn an der Carnegie Mellon University allerdings erst drei  Jahre später.

Die neue reCaptcha-Checkbox enthält nur einen Haken. © Screenshot

Bessere Captchas, bessere Bots

Zu diesem Zeitpunkt bestanden Captchas aus Zeichenfolgen unterschiedlicher Länge, die sich im Netz wie "Pickel auf dem Gesicht eines Teenagers" verbreiteten, wie es in einem charmanten YouTube-Video heißt. Doch es gab ein Problem: Immer mehr Bots konnten die einfachen Eingaben überlisten, indem sie Schwachstellen ausnutzten oder per Schrifterkennung die Zeichen lasen. Das führte dazu, dass die Captchas selbst immer unkenntlicher wurden, bis sie schließlich auch von Menschen nicht mehr zuverlässig erkannt wurden.

Den Ausweg aus diesem Teufelskreis erfand wieder Luis von Ahn. Mit reCaptcha entwickelten er und seine Kollegen ein neues Captcha-System, das ausreichend flexibel war, um die Bots auszugrenzen und dennoch einigermaßen nutzerfreundlich blieb. Auch wenn die Captchas unter den Gesichtspunkten der Barrierefreiheit weiterhin ein großes Problem darstellten.

ReCaptcha hatte noch einen weiteren Vorteil: Es nutzte Scans aus Büchern und ließ diese dadurch von den Menschen digitalisieren. Wort für Wort wurde somit unter anderem das Archiv der New York Times digitalisiert. Endlich konnte die verlorene Arbeitskraft durch das tägliche Entziffern von Captchas – nach Hochrechnungen der Forscher bis zu 500.000 Stunden am Tag –  sinnvoll genutzt werden. 2009 übernahm Google das Projekt und machte es zum weltweit beliebtesten Captcha-System. Wobei beliebt hier eine eher quantitative Bedeutung hat.

Doch auch reCaptcha ist nicht unfehlbar. Im Oktober 2013 demonstrierte ein Start-up namens Vicarious, dass seine Software reCaptchas mit 90-prozentiger Erfolgsrate lösen konnte. Google selbst legte im Frühjahr noch einen drauf und gab an, mit einem neuen Algorithmus die eigene Technik in 99,8 der Fälle überlisten zu können. Höchste Zeit also für das Ende der Captchas.