Erinnert sich noch jemand an Altavista? Vor zehn Jahren war die Suchmaschine noch der große Konkurrent von Google. Niemand glaubte, dass Google irgendwann einmal Altavista übertreffen könnte. Heute sind alle schlauer. Und wegen der Übermacht Googles hoffen nun viele auf eine Alternative, auf eine neue Suchmaschine, die den König vom Thron stößt.

Doch einen Google-Killer, wie die Plattform des britischen Mathematikers Stephen Wolfram Wolfram-Alpha angepriesen wurde, wird sicherlich kein Programmierer so schnell aus dem Boden stampfen. Doch wer mit Entwicklern über semantische Suchmaschinen spricht, stellt rasch fest, dass dieses Ziel auch niemand verfolgt. Vielmehr geht es allen darum, große, komplexe Datenmengen innerhalb eines vorgegebenen Rahmens zu strukturieren – man wird eben in all den Feldern aktiv, wo Google einem Platz übrig lässt.

Ein Beispiel ist ConWeaver, eine semantische Suchmaschine, die von einer in Darmstadt ansässigen Ausgliederung des Fraunhofer-Instituts für Graphische Datenverarbeitung entwickelt wird: Firmen haben mit ihr die Möglichkeit, ihre im Intranet angehäuften Daten leichter und schneller verfügbar zu machen. Dazu generiert die Software Wissensnetze, die die verfügbaren Informationen miteinander in Beziehung stellen und sie nach unterschiedlichen Kategorien präsentieren.

Zu abstrakt? Vielleicht hilft eine Erklärung von Thomas Kamps, der sich seit Beginn der 1990er Jahre mit semantischen Technologien beschäftigt und heute Leiter des ConWeaver-Teams ist: "Bei einem unserer Kunden sind die Nutzer Projektingenieure. Einer von ihnen soll wegen eines neuen Tunnelbaus nach Australien gehen, doch er kennt sich nicht mit dem australischen Baurecht aus. Also muss er nach jemandem suchen, der sich bereits mit der Thematik auskennt. Nach Eingabe der Begriffe Tunnelbau und Australien findet unser System dann unter Berücksichtigung der englischsprachigen Übersetzung tunneling einen Projektbericht, der an einem Projekt hängt, das in der Projektdatenbank gespeichert ist. So lässt sich dann ein potenzieller Ansprechpartner finden."

Das bedeutet, dass die Wissensnetze logische Schlussfolgerungen ziehen. Doch der Aufwand dahinter ist immens: Bei großen Datenmengen sind es gut 20 Millionen Verknüpfungen die hergestellt werden müssen, unter Umständen gar eine Milliarde. Daher ist es das Ziel, eine geführte Suche zu entwickeln: "Gibt man bei Google Fußball ein, dann erhält man über zwei Millionen Einträge, doch das ist ja viel zu ungenau", sagt Kamps. Also will ConWeaver im ersten Schritt Vorschläge, mit denen sich die Suche eingrenzen lässt. Dann bekomme der Nutzer den Hinweis, dass es in Zusammenhang mit diesem Begriff noch weitere gebe.

Die Suchmaschine muss also den Kontext erkennen. Das heißt, verstehen, welche anderen Begriffe verwandt sind, beziehungsweise innerhalb eines Wissensnetzes in der Nähe liegen.

Können semantische Suchmaschinen also überhaupt für die Suche im Internet eingesetzt werden, oder eignen sie sich nur zur Strukturierung in geschlossenen Systemen? Nein, wahrscheinlich können sie nur in engen Bereichen funktionieren. Gerhard Rolletschek, der unter anderem an der Entwicklung der Hotelsuch- und -bewertungsplattform TrustYou (www.trustyou.com) mitgearbeitet hat, sagt, semantische Suchmaschinen hätten eine Grenze: "Ihre Umsetzung ist bisher nur in abgegrenzten Domänen gut gelungen." Schließlich erforderten sie "profundes Wissen über den behandelten Bereich".