Suchmaschinen

Semantische Suche ist kein Wundermittel

Im nahezu grenzenlosen Netz sind semantische Suchmaschinen verloren. Nur in eng begrenzten Bereichen können sie neue Perspektiven eröffnen

Wie Neuronen im Hirn wollen semantische Suchmaschinen Wissen verknüpfen

Wie Neuronen im Hirn wollen semantische Suchmaschinen Wissen verknüpfen

Erinnert sich noch jemand an Altavista? Vor zehn Jahren war die Suchmaschine noch der große Konkurrent von Google. Niemand glaubte, dass Google irgendwann einmal Altavista übertreffen könnte. Heute sind alle schlauer. Und wegen der Übermacht Googles hoffen nun viele auf eine Alternative, auf eine neue Suchmaschine, die den König vom Thron stößt.

Doch einen Google-Killer, wie die Plattform des britischen Mathematikers Stephen Wolfram Wolfram-Alpha angepriesen wurde, wird sicherlich kein Programmierer so schnell aus dem Boden stampfen. Doch wer mit Entwicklern über semantische Suchmaschinen spricht, stellt rasch fest, dass dieses Ziel auch niemand verfolgt. Vielmehr geht es allen darum, große, komplexe Datenmengen innerhalb eines vorgegebenen Rahmens zu strukturieren – man wird eben in all den Feldern aktiv, wo Google einem Platz übrig lässt.

Ein Beispiel ist ConWeaver, eine semantische Suchmaschine, die von einer in Darmstadt ansässigen Ausgliederung des Fraunhofer-Instituts für Graphische Datenverarbeitung entwickelt wird: Firmen haben mit ihr die Möglichkeit, ihre im Intranet angehäuften Daten leichter und schneller verfügbar zu machen. Dazu generiert die Software Wissensnetze, die die verfügbaren Informationen miteinander in Beziehung stellen und sie nach unterschiedlichen Kategorien präsentieren.

Anzeige

Zu abstrakt? Vielleicht hilft eine Erklärung von Thomas Kamps, der sich seit Beginn der 1990er Jahre mit semantischen Technologien beschäftigt und heute Leiter des ConWeaver-Teams ist: "Bei einem unserer Kunden sind die Nutzer Projektingenieure. Einer von ihnen soll wegen eines neuen Tunnelbaus nach Australien gehen, doch er kennt sich nicht mit dem australischen Baurecht aus. Also muss er nach jemandem suchen, der sich bereits mit der Thematik auskennt. Nach Eingabe der Begriffe Tunnelbau und Australien findet unser System dann unter Berücksichtigung der englischsprachigen Übersetzung tunneling einen Projektbericht, der an einem Projekt hängt, das in der Projektdatenbank gespeichert ist. So lässt sich dann ein potenzieller Ansprechpartner finden."

Das bedeutet, dass die Wissensnetze logische Schlussfolgerungen ziehen. Doch der Aufwand dahinter ist immens: Bei großen Datenmengen sind es gut 20 Millionen Verknüpfungen die hergestellt werden müssen, unter Umständen gar eine Milliarde. Daher ist es das Ziel, eine geführte Suche zu entwickeln: "Gibt man bei Google Fußball ein, dann erhält man über zwei Millionen Einträge, doch das ist ja viel zu ungenau", sagt Kamps. Also will ConWeaver im ersten Schritt Vorschläge, mit denen sich die Suche eingrenzen lässt. Dann bekomme der Nutzer den Hinweis, dass es in Zusammenhang mit diesem Begriff noch weitere gebe.

Die Suchmaschine muss also den Kontext erkennen. Das heißt, verstehen, welche anderen Begriffe verwandt sind, beziehungsweise innerhalb eines Wissensnetzes in der Nähe liegen.

Können semantische Suchmaschinen also überhaupt für die Suche im Internet eingesetzt werden, oder eignen sie sich nur zur Strukturierung in geschlossenen Systemen? Nein, wahrscheinlich können sie nur in engen Bereichen funktionieren. Gerhard Rolletschek, der unter anderem an der Entwicklung der Hotelsuch- und -bewertungsplattform TrustYou (www.trustyou.com) mitgearbeitet hat, sagt, semantische Suchmaschinen hätten eine Grenze: "Ihre Umsetzung ist bisher nur in abgegrenzten Domänen gut gelungen." Schließlich erforderten sie "profundes Wissen über den behandelten Bereich".

Anzeige
Leser-Kommentare

    • 28.05.2009 um 8:15 Uhr
    • peto1

    Das grund problem sind die Konzepte der Suchmaschienen, wen man die Funktionen genauer anschaut sind sie alle Ein Dimensional und das ist ein Fehler.

  1. In dem von ihnen verlinkten Artikel vom 14.5. schreiben Sie:
    Stephen Wolfram hat in den vergangenen zwei Monaten immer wieder lautstark und vorauseilend betont, er habe keinen »Google-Killer« erfunden.
    Und dieses mal schreiben Sie:
    Doch einen Google-Killer, wie der britische Mathematiker Stephen Wolfram seine Plattform Wolfram-Alpha im Internet angepriesen hat
    Hat er jetzt seine Seite als "google Killer" angepriesen oder haben die Medien dies daraus gemacht?

    Reaktionen auf diesen Kommentar anzeigen
    Blogs   Kikkoman

    Falls sie auf der Suche nach fachlichen und kompetenten Beiträgen sind, dann sollte sie lieber Blogs lesen. Immer daran denken: Journalisten schreiben für Geld, nicht aus Idealismus. ;-)

    Killer   Kai Biermann

    Sehr geehrter Herr Fuchs,

    danke für den Hinweis. Allerdings unterstellt unser Autor Christoph Drösser, dass Wolfram eben dadurch, dass er immer verneinte, einen Google-Killer gebaut zu haben, dieses Gerücht beförderte:

    "Stephen Wolfram hat in den vergangenen zwei Monaten immer wieder lautstark und vorauseilend betont, er habe keinen »Google-Killer« erfunden. Diese penetrante Bescheidenheit war höchst geschickt – führte sie doch zu einer Welle von Artikeln, die genau darüber orakelten: Ob seine »Antwortmaschine« www.wolframalpha.com, die kommende Woche starten soll, das nächste Google sei. Der Hype ist also gewaltig."

    Ich habe den Satz aber etwas umformuliert, so dass es nicht mehr so widersprüchlich klingt.

    Beste Grüße
    Kai Biermann

  2. 3. Blogs

    Falls sie auf der Suche nach fachlichen und kompetenten Beiträgen sind, dann sollte sie lieber Blogs lesen. Immer daran denken: Journalisten schreiben für Geld, nicht aus Idealismus. ;-)

    Antwort auf "Wiederspruch"
  3. http://www.chillingeffect...

    ihren zeit artikel hat google schon mal gefunden
    google nimmt einem natürlich nicht das denken ab:
    beim tunnelbau könnte man auch nach der dortigen architekten ingenieur vereinigung suchen

    interessantes nebenprodukt - der search comparator zeigt auch an, welche seiten
    in einzelnen ländern unterdrückt werden.

  4. 5. Killer

    Sehr geehrter Herr Fuchs,

    danke für den Hinweis. Allerdings unterstellt unser Autor Christoph Drösser, dass Wolfram eben dadurch, dass er immer verneinte, einen Google-Killer gebaut zu haben, dieses Gerücht beförderte:

    "Stephen Wolfram hat in den vergangenen zwei Monaten immer wieder lautstark und vorauseilend betont, er habe keinen »Google-Killer« erfunden. Diese penetrante Bescheidenheit war höchst geschickt – führte sie doch zu einer Welle von Artikeln, die genau darüber orakelten: Ob seine »Antwortmaschine« www.wolframalpha.com, die kommende Woche starten soll, das nächste Google sei. Der Hype ist also gewaltig."

    Ich habe den Satz aber etwas umformuliert, so dass es nicht mehr so widersprüchlich klingt.

    Beste Grüße
    Kai Biermann

    Antwort auf "Wiederspruch"
  5. Wie sollen denn bitte schön Turing-Maschinen die Semantik eines natürlichen Textes verstehen können?

    Joseph Weizenbaum hat in der »Macht der Computer und die Ohnmacht der Vernunft« wunderbar beschrieben, warum natürliche Sprache nicht durch Computer verarbeitet werden kann, es sei denn man grenzt Verarbeitung soweit ein, wie es die Hilfswissenschaften Mathematik und Informatik tun.

    Er hat übrigens auch beschrieben, warum die künstliche Intelligenzia an der Idee der KI festhält. NSA und Carnivore lassen grüssen ...

    Computer sind eben nicht in der Lage, den Kontext eines Textes zu interpretieren.

    Keine »Information« ist ein Datum, ausgenommen im Licht einer Hypothese. Selbst in einer normalen Unterhaltung zwischen zwei Personen bringt deshalb jeder Gesprächspartner etwas von sich ein, was den Prozeß des gegenseitigen Verstehens beeinflußt. Jeder hat mit anderen Worten eine Arbeitshypothese, wiederum einen Begriffsrahmen hinsichtlich dessen, wer der andere ist und worüber beide sprechen. Diese Hypothese dient als Prognose dafür, was der andere sagen wird und, noch wichtiger, was er mit dem auszudrücken beabsichtigt was er sagen wird.

    Diese Hypothese wird von jedem der an der Kommunikation beteiligten Individuen individuell konstruiert. Es gibt keine identischen mentalen Repräsentationen der wahrgenommenen Umwelt in 2 Individuen, ebensowenig wie es 2 gleiche Biographien gibt. Und genau dieser Hintergrund der Kommunikation, der immer gegenwärtig ist -- schließlich schrieb schon Paul Watzlawick das man nicht nicht kommunizieren kann -- bestimmt die Arbeitshypothese der menschlichen Sprachverarbeitung.

    Dies geht sogar soweit, das wir antropomorphisieren und mit Nicht-Menschen kommunizieren, seien die eigenen Meerschweinchen, der freundliche VW-Käfer oder der böse 7er BMW.

    All diese Kontextbildung wird zwar kulturell normiert -- man denke nur an das Hakenkreuz, das hier das ultimative Böse[tm] ist, in Asien aber ein Glückssymbol. Was es in Europa übrigens auch einmal war.
    Trotzdem ist die kontextuelle Rahmung der Kommunikation abhängig vom Individuum, mithin also radikal konstruktivistisch.

    Folgt man dieser Theorie, ist es nicht möglich, das 2 Menschen ein und die selbe Situation (oder Kommunikation) genau gleich interpretieren.

    Da Computer aber nicht in der Lage sind, derartige kontextuelle Einflüsse selbst zu generieren (sprich: zu erlernen), sind sie auch nicht in der Lage, Texte oder Kommunikation entsprechend zu interpretieren.
    Würde man also einen Interpreter für natürliche Sprache entwerfen, könnte man wohl syntaktische Daten analysieren (Wieviel Kommas, Punkte, a, e, i, o, u stecken im Faust oder Werther), aber die berühmte (oder berüchtigte) Frage, »Was will uns der Dichter eigentlich sagen?« kann der Computer nicht beantworten, da er schlicht nicht in der Lage ist, o.g. Kontexte einzubinden und dabei sein Turingband zu verlassen.

    Ein derartig aufgebauter Interpreter -- nichts anderes ist ja eine Suchmaschine -- könnte nur Trivialdaten liefern oder eine Kopie des Originals -- beides für den Suchenden nicht von Interesse.

    Um wirklich semantisch suchen zu können -- der geneigte Student erlernt es meist als »Literaturrecherche« und »exzerpieren« -- muss die Maschine in der Lage sein, eine eigene mentale Repräsentation ihrer selbst und ihrer Umwelt aufzubauen. Sie benötigt also eine Identität, ein »Ich bin« und eine Repräsentation all dessen, was nicht »Ich« ist.

    Dazu muss sie lernen können -- und ich meine hier nicht die simplen behavioristischen Lerntheorien a la »Lernen bedeutet langfristig die Änderung kortikaler Repräsentationen« (Manfred Spitzer - Lernen: Gehirnforschung und die Schule des Lebens (S. 183))«, sondern eher die Art von Lernen und Erkenntnis, die Jean Piaget in seiner genetischen Epistemologie beschrieben hat.

    Die Suchmaschine muss ein Wissensnetz aufbauen, in das sie äussere Einflüsse assimiliert und das sie ggf. akkomodiert, also verändert. Um neues Wissen zu erwerben muss sie aber einen Grund dafür haben, also ein Motiv oder Motivation. Piaget sprach daher von der Äquilibration, also einer Art Ungleichgewicht zwischen wahrgenommener, äußerer Umwelt und repräsentierter, innerer Umwelt. Dieser Unterschied, koginitive Dissonanz genannt, führt eben zur Assimilation neuen Wissens oder aber zur Akkomodation (Veränderung, Anpassung) der inneren, repräsentierten Umwelt.

    Nur mit diesem inneren Wissensnetz versehen, kann ein Mensch oder ein Computer überhaupt Texte »verstehen«, »sinnvoll interpretieren« oder eben auch »durchsuchen«.

    Dies kann der Computer eben nicht, er kann nur eine Reduktion der Texte nach festgelegten Regeln liefern, sofern die Regeln deterministisch und determinierbar, also algorithmisierbar sind.
    Diese (vereinfachten) Kopien der Realität werden unter dem Etikett »Objektivität« gerne gefordert, sind aber Erkenntnistheoretisch von fragwürdigem Nutzen bzw. wahrnehmungspsychologisch von Menschen nicht leistbar, wie Heinz von Foerster in seiner Kybern-Ethik bzw. Kybernethik zweiter Ordnung festgestellt hat.

    Die Semantik eines Textes oder von Kommunikation liegt eben nicht im Datum, das in der Welt existiert, sondern in dessen Interpretation im Individuum.

    Mir ist aber nicht bekannt, das ein Computer etwas möchte, also ein Motiv oder gar eine Motivation hat. Er ist genauso leb- und willenlos wie ein Hammer, eine Wasserpumpenzange, der Hilbertraum oder das Gaußsche Eliminationsverfahren. Eben nur ein Werkzeug, mit dem Menschen arbeiten können, aber nicht selbst in der Lage ist, die Welt zu interpretieren.

    Fazit: Computer sind nicht in der Lage Texte zu interpretieren und werden es auch nie sein können. Ihnen fehlen einfach die Grundvoraussetzungen, sinnvolle Interpretationen zu liefern. Wären Sie dazu jemals in der Lage, dürften sich ihre Ergebnisse darüberhinaus nicht von denen von Menschen unterscheiden (vgl. Turing-Test).

    Als weiterführende Literatur möchte ich unbedingt Joseph Weizenbaum Die Macht der Computer und die Ohnmacht der Vernunft, alles von Paul Watzlawick, Heinz von Foerster und Ernst von Glasersfeld sowie Piagets genetische Epistemologie empfehlen. Und natürlich die letzten Jahrtausende Philosophie.

    Reaktionen auf diesen Kommentar anzeigen

    wenn eine KI eine sinnvolle Interpretation von Moby Dick liefert. Bis dahin: Ein weiter Weg.
    Ich enpfehle zusätzlich zur Lektüre: Wittgenstein, vorzugsweise vollständig.

    _________________________________________________
    In diesem Wahljahr werde ich mich für keine Partei
    aussprechen und zu keinem Parteiprogramm. Aber ich
    werde nicht aufhören, zu sagen, dass diese Krise eine
    ideologische Heimat hat: die FDP.…
    ______

  6. wenn eine KI eine sinnvolle Interpretation von Moby Dick liefert. Bis dahin: Ein weiter Weg.
    Ich enpfehle zusätzlich zur Lektüre: Wittgenstein, vorzugsweise vollständig.

    _________________________________________________
    In diesem Wahljahr werde ich mich für keine Partei
    aussprechen und zu keinem Parteiprogramm. Aber ich
    werde nicht aufhören, zu sagen, dass diese Krise eine
    ideologische Heimat hat: die FDP.…
    ______

    Antwort auf "Ghost in the /bin/sh?"
  7. Semantische Suchmaschinen, die gut funktionieren, das ist ja eher Zukunftsmusik. Die Suche selbst ist schon gut, entscheidend ist doch die Darstellung der Ergebnisse. Eine gute Struktur, übersichtliche Ansicht mit Vorschaufenstern zu den einzelnen Ergebnissen, sowas gibt es jetzt: Wenn auch noch in der Beta Phase, ist www.mageleo.de ein Beispiel für erfolgreiches Finden, effizient und benutzerfreundlich.

Bitte melden Sie sich an, um zu kommentieren
  • Von Frank Magdans
  • Datum 28.5.2009 - 09:34 Uhr
  • Seite 1 | 2 | Auf einer Seite lesen
  • Quelle ZEIT ONLINE
  • Kommentare 10
  • Empfehlen E-Mail verschicken | Bookmarks
  • Artikel Drucken Druckversion | PDF
  • Schlagworte Internet | Suchmaschine
  • Artikel-Tools präsentiert von:

Service