"Wann wurde die Berliner Mauer gebaut?" Gibt man diese Frage bei Google ein, so spuckt die Suchmaschine 198.000 Treffer in 0,22 Sekunden aus. Das Dokument, das ganz oben steht, heißt "Warum die Berliner Mauer gebaut wurde", und wenn man sich die Mühe macht, es vollständig zu lesen, findet man im vorletzten Satz die Antwort: "Am 13. August 1961 wurde die Sektorengrenze zwischen Ost- und West-Berlin geschlossen."

Wäre es nicht besser, man bekäme eine Antwort, ohne erst zwei Seiten Text mühsam durchforsten zu müssen?

Vierzig Prozent aller Suchanfragen, hat man herausgefunden, liefern dem Nutzer kein befriedigendes Ergebnis. Das kann natürlich daran liegen, dass das Internet die Antwort nicht parat hält – in den meisten Fällen aber gelingt es der Suchmaschine nicht, die Spreu vom Weizen zu trennen und die wirklich relevanten Dokumente ganz oben zu platzieren. Google und Co. sind eigentlich nicht mehr als ein großes Inhaltsverzeichnis des Netzes, sie verstehen den Sinn unserer Frage nicht.

Tim Berners-Lee, der Erfinder des World Wide Web, hatte als erster die Idee, das Netz mit Sinn zu bereichern. "Semantisches Web" nannte er das. Nach seiner Vorstellung sollte jede Webseite mit sogenannten Metadaten versehen werden – unsichtbaren Hintergrundinformationen, die der Maschine die Einordnung dieser Seite erleichtern. Ein Zahnarzt könnte etwa codieren, welche besonderen Leistungen er anbietet, und eine Suchmaschine könnte dann alle Zahnärzte auflisten, die mit einem schmerzarmen Wasserbohrer arbeiten.

Aber diese Idee hat sich als nicht praktikabel erwiesen. Denn die meisten Menschen, die Seiten ins Netz stellen, scheren sich nicht um Metadaten, sie wissen gar nicht, was das ist, beziehungsweise sind zu faul, sich auf die Ebene der Maschinensprache zu begeben. Trotzdem wäre es schön, wenn die Maschine Struktur und Inhalt einer Seite verstehen könnte. Also – die menschliche Sprache.

Das versucht zum Beispiel Hermann Helbig von der Fernuniversität Hagen ihnen beizubringen. Seiner Antwortmaschine Sempria kann man tatsächlich eine Frage auf Deutsch stellen, und der Computer antwortet auf Deutsch. "Wann wurde die Berliner Mauer gebaut?" – "Am 13.8.1961 (Qualität 75%)."