Suchmaschinen Semantische Suche ist kein Wundermittel
Im nahezu grenzenlosen Netz sind semantische Suchmaschinen verloren. Nur in eng begrenzten Bereichen können sie neue Perspektiven eröffnen

© Getty Images
Wie Neuronen im Hirn wollen semantische Suchmaschinen Wissen verknüpfen
Erinnert sich noch jemand an Altavista? Vor zehn Jahren war die Suchmaschine noch der große Konkurrent von Google. Niemand glaubte, dass Google irgendwann einmal Altavista übertreffen könnte. Heute sind alle schlauer. Und wegen der Übermacht Googles hoffen nun viele auf eine Alternative, auf eine neue Suchmaschine, die den König vom Thron stößt.
Doch einen Google-Killer, wie die Plattform des britischen Mathematikers Stephen Wolfram Wolfram-Alpha angepriesen wurde, wird sicherlich kein Programmierer so schnell aus dem Boden stampfen. Doch wer mit Entwicklern über semantische Suchmaschinen spricht, stellt rasch fest, dass dieses Ziel auch niemand verfolgt. Vielmehr geht es allen darum, große, komplexe Datenmengen innerhalb eines vorgegebenen Rahmens zu strukturieren – man wird eben in all den Feldern aktiv, wo Google einem Platz übrig lässt.
Ein Beispiel ist ConWeaver, eine semantische Suchmaschine, die von einer in Darmstadt ansässigen Ausgliederung des Fraunhofer-Instituts für Graphische Datenverarbeitung entwickelt wird: Firmen haben mit ihr die Möglichkeit, ihre im Intranet angehäuften Daten leichter und schneller verfügbar zu machen. Dazu generiert die Software Wissensnetze, die die verfügbaren Informationen miteinander in Beziehung stellen und sie nach unterschiedlichen Kategorien präsentieren.
Zu abstrakt? Vielleicht hilft eine Erklärung von Thomas Kamps, der sich seit Beginn der 1990er Jahre mit semantischen Technologien beschäftigt und heute Leiter des ConWeaver-Teams ist: "Bei einem unserer Kunden sind die Nutzer Projektingenieure. Einer von ihnen soll wegen eines neuen Tunnelbaus nach Australien gehen, doch er kennt sich nicht mit dem australischen Baurecht aus. Also muss er nach jemandem suchen, der sich bereits mit der Thematik auskennt. Nach Eingabe der Begriffe Tunnelbau und Australien findet unser System dann unter Berücksichtigung der englischsprachigen Übersetzung tunneling einen Projektbericht, der an einem Projekt hängt, das in der Projektdatenbank gespeichert ist. So lässt sich dann ein potenzieller Ansprechpartner finden."
Das bedeutet, dass die Wissensnetze logische Schlussfolgerungen ziehen. Doch der Aufwand dahinter ist immens: Bei großen Datenmengen sind es gut 20 Millionen Verknüpfungen die hergestellt werden müssen, unter Umständen gar eine Milliarde. Daher ist es das Ziel, eine geführte Suche zu entwickeln: "Gibt man bei Google Fußball ein, dann erhält man über zwei Millionen Einträge, doch das ist ja viel zu ungenau", sagt Kamps. Also will ConWeaver im ersten Schritt Vorschläge, mit denen sich die Suche eingrenzen lässt. Dann bekomme der Nutzer den Hinweis, dass es in Zusammenhang mit diesem Begriff noch weitere gebe.
Die Suchmaschine muss also den Kontext erkennen. Das heißt, verstehen, welche anderen Begriffe verwandt sind, beziehungsweise innerhalb eines Wissensnetzes in der Nähe liegen.
Können semantische Suchmaschinen also überhaupt für die Suche im Internet eingesetzt werden, oder eignen sie sich nur zur Strukturierung in geschlossenen Systemen? Nein, wahrscheinlich können sie nur in engen Bereichen funktionieren. Gerhard Rolletschek, der unter anderem an der Entwicklung der Hotelsuch- und -bewertungsplattform TrustYou (www.trustyou.com) mitgearbeitet hat, sagt, semantische Suchmaschinen hätten eine Grenze: "Ihre Umsetzung ist bisher nur in abgegrenzten Domänen gut gelungen." Schließlich erforderten sie "profundes Wissen über den behandelten Bereich".
Semantische Suchmaschinen mit allgemeiner Ausrichtung seien daher bis jetzt ohne größeren Erfolg geblieben. Da macht Google immer noch das Rennen. Zumal die Google-Programmierer ihrem Algorithmus immer neue Feinheiten hinzufügen; neuerdings lässt sich beispielsweise der Zeitraum der Suche eingrenzen.
Trotz aller Einschränkungen haben Elemente der semantischen Suche längst ihren Niederschlag im Internet gefunden. Smart IP Solutions etwa bietet für den Patentmarkt eine semantische Lösung an. Das System ProSearch arbeitet nicht mit einzelnen Suchwörtern, sondern versteht das technische Konzept, welches einem Patent zu Grunde liegt. Mit Erfolg werden Software und Datenbank bereits von Unternehmen wie IBM, Microsoft und TexasInstruments eingesetzt. Und auch Yahoo! hat zugelegt. Wer die Suchmaschine ansteuert, bekommt Vorschläge zur Differenzierung serviert. Ask (www.ask.com) und Clusty (www.clusty.com) helfen ebenfalls beim Ausweiten oder Eingrenzen der Resultate.
Darüber hinaus versuchen viele Firmen, den Communitygedanken, im Web-2.0-Jargon Folksonomy genannt, bei der Suche zu integrieren. Lycos setzt das mit IQ um, Yahoo! mit Answers und auch mit der Fotoplattform Flickr.
In allen Fällen kommen dabei sogenannte Tags zum Tragen, von den Nutzern selbst eingespeiste Schlagworte. Eine Software analysiert diese dahingehend, inwiefern sie sich mit Inhalten von Websites decken. Wie bei den Wissensnetzen von Conweaver geht es darum, Zusammenhänge herauszufiltern.
Dennoch werden soziale Suchmaschinen, die als Ergänzung zu den semantischen zu sehen sind, genau wie diese keine Wunder vollbringen. "Auf jeder Suchmaschine ist die Hälfte aller Suchanfragen neu, wurde so also noch nie vorher gestellt", sagt Rolletschek. Damit aber würden soziale und semantische Maschinen nicht klarkommen. Wohl auch ein Grund, warum Wiki Search eingestellt wurde. Auch diese wurde eine Zeit lang als "potenzieller Google-Killer" gehandelt. Doch der Aufwand dafür war wohl zu groß. Wikipedia-Gründer Jimmy Wales zumindest erklärte, aus wirtschaftlichen Erwägungen habe man sie abgeschaltet.
- Datum 28.05.2009 - 10:34 Uhr
- Seite 1 | 2 | Auf mehreren Seiten lesen
- Quelle ZEIT ONLINE
- Kommentare 10
- Versenden E-Mail verschicken
- Empfehlen Facebook, Twitter, Google+
- Artikel Drucken Druckversion | PDF
-
Artikel-Tools präsentiert von:






Das grund problem sind die Konzepte der Suchmaschienen, wen man die Funktionen genauer anschaut sind sie alle Ein Dimensional und das ist ein Fehler.
In dem von ihnen verlinkten Artikel vom 14.5. schreiben Sie:
Stephen Wolfram hat in den vergangenen zwei Monaten immer wieder lautstark und vorauseilend betont, er habe keinen »Google-Killer« erfunden.
Und dieses mal schreiben Sie:
Doch einen Google-Killer, wie der britische Mathematiker Stephen Wolfram seine Plattform Wolfram-Alpha im Internet angepriesen hat
Hat er jetzt seine Seite als "google Killer" angepriesen oder haben die Medien dies daraus gemacht?
Falls sie auf der Suche nach fachlichen und kompetenten Beiträgen sind, dann sollte sie lieber Blogs lesen. Immer daran denken: Journalisten schreiben für Geld, nicht aus Idealismus. ;-)
Sehr geehrter Herr Fuchs,
danke für den Hinweis. Allerdings unterstellt unser Autor Christoph Drösser, dass Wolfram eben dadurch, dass er immer verneinte, einen Google-Killer gebaut zu haben, dieses Gerücht beförderte:
"Stephen Wolfram hat in den vergangenen zwei Monaten immer wieder lautstark und vorauseilend betont, er habe keinen »Google-Killer« erfunden. Diese penetrante Bescheidenheit war höchst geschickt – führte sie doch zu einer Welle von Artikeln, die genau darüber orakelten: Ob seine »Antwortmaschine« www.wolframalpha.com, die kommende Woche starten soll, das nächste Google sei. Der Hype ist also gewaltig."
Ich habe den Satz aber etwas umformuliert, so dass es nicht mehr so widersprüchlich klingt.
Beste Grüße
Kai Biermann
Falls sie auf der Suche nach fachlichen und kompetenten Beiträgen sind, dann sollte sie lieber Blogs lesen. Immer daran denken: Journalisten schreiben für Geld, nicht aus Idealismus. ;-)
Sehr geehrter Herr Fuchs,
danke für den Hinweis. Allerdings unterstellt unser Autor Christoph Drösser, dass Wolfram eben dadurch, dass er immer verneinte, einen Google-Killer gebaut zu haben, dieses Gerücht beförderte:
"Stephen Wolfram hat in den vergangenen zwei Monaten immer wieder lautstark und vorauseilend betont, er habe keinen »Google-Killer« erfunden. Diese penetrante Bescheidenheit war höchst geschickt – führte sie doch zu einer Welle von Artikeln, die genau darüber orakelten: Ob seine »Antwortmaschine« www.wolframalpha.com, die kommende Woche starten soll, das nächste Google sei. Der Hype ist also gewaltig."
Ich habe den Satz aber etwas umformuliert, so dass es nicht mehr so widersprüchlich klingt.
Beste Grüße
Kai Biermann
Falls sie auf der Suche nach fachlichen und kompetenten Beiträgen sind, dann sollte sie lieber Blogs lesen. Immer daran denken: Journalisten schreiben für Geld, nicht aus Idealismus. ;-)
http://www.chillingeffect...
ihren zeit artikel hat google schon mal gefunden
google nimmt einem natürlich nicht das denken ab:
beim tunnelbau könnte man auch nach der dortigen architekten ingenieur vereinigung suchen
interessantes nebenprodukt - der search comparator zeigt auch an, welche seiten
in einzelnen ländern unterdrückt werden.
Sehr geehrter Herr Fuchs,
danke für den Hinweis. Allerdings unterstellt unser Autor Christoph Drösser, dass Wolfram eben dadurch, dass er immer verneinte, einen Google-Killer gebaut zu haben, dieses Gerücht beförderte:
"Stephen Wolfram hat in den vergangenen zwei Monaten immer wieder lautstark und vorauseilend betont, er habe keinen »Google-Killer« erfunden. Diese penetrante Bescheidenheit war höchst geschickt – führte sie doch zu einer Welle von Artikeln, die genau darüber orakelten: Ob seine »Antwortmaschine« www.wolframalpha.com, die kommende Woche starten soll, das nächste Google sei. Der Hype ist also gewaltig."
Ich habe den Satz aber etwas umformuliert, so dass es nicht mehr so widersprüchlich klingt.
Beste Grüße
Kai Biermann
Wie sollen denn bitte schön Turing-Maschinen die Semantik eines natürlichen Textes verstehen können?
Joseph Weizenbaum hat in der »Macht der Computer und die Ohnmacht der Vernunft« wunderbar beschrieben, warum natürliche Sprache nicht durch Computer verarbeitet werden kann, es sei denn man grenzt Verarbeitung soweit ein, wie es die Hilfswissenschaften Mathematik und Informatik tun.
Er hat übrigens auch beschrieben, warum die künstliche Intelligenzia an der Idee der KI festhält. NSA und Carnivore lassen grüssen ...
Computer sind eben nicht in der Lage, den Kontext eines Textes zu interpretieren.
Keine »Information« ist ein Datum, ausgenommen im Licht einer Hypothese. Selbst in einer normalen Unterhaltung zwischen zwei Personen bringt deshalb jeder Gesprächspartner etwas von sich ein, was den Prozeß des gegenseitigen Verstehens beeinflußt. Jeder hat mit anderen Worten eine Arbeitshypothese, wiederum einen Begriffsrahmen hinsichtlich dessen, wer der andere ist und worüber beide sprechen. Diese Hypothese dient als Prognose dafür, was der andere sagen wird und, noch wichtiger, was er mit dem auszudrücken beabsichtigt was er sagen wird.
Diese Hypothese wird von jedem der an der Kommunikation beteiligten Individuen individuell konstruiert. Es gibt keine identischen mentalen Repräsentationen der wahrgenommenen Umwelt in 2 Individuen, ebensowenig wie es 2 gleiche Biographien gibt. Und genau dieser Hintergrund der Kommunikation, der immer gegenwärtig ist -- schließlich schrieb schon Paul Watzlawick das man nicht nicht kommunizieren kann -- bestimmt die Arbeitshypothese der menschlichen Sprachverarbeitung.
Dies geht sogar soweit, das wir antropomorphisieren und mit Nicht-Menschen kommunizieren, seien die eigenen Meerschweinchen, der freundliche VW-Käfer oder der böse 7er BMW.
All diese Kontextbildung wird zwar kulturell normiert -- man denke nur an das Hakenkreuz, das hier das ultimative Böse[tm] ist, in Asien aber ein Glückssymbol. Was es in Europa übrigens auch einmal war.
Trotzdem ist die kontextuelle Rahmung der Kommunikation abhängig vom Individuum, mithin also radikal konstruktivistisch.
Folgt man dieser Theorie, ist es nicht möglich, das 2 Menschen ein und die selbe Situation (oder Kommunikation) genau gleich interpretieren.
Da Computer aber nicht in der Lage sind, derartige kontextuelle Einflüsse selbst zu generieren (sprich: zu erlernen), sind sie auch nicht in der Lage, Texte oder Kommunikation entsprechend zu interpretieren.
Würde man also einen Interpreter für natürliche Sprache entwerfen, könnte man wohl syntaktische Daten analysieren (Wieviel Kommas, Punkte, a, e, i, o, u stecken im Faust oder Werther), aber die berühmte (oder berüchtigte) Frage, »Was will uns der Dichter eigentlich sagen?« kann der Computer nicht beantworten, da er schlicht nicht in der Lage ist, o.g. Kontexte einzubinden und dabei sein Turingband zu verlassen.
Ein derartig aufgebauter Interpreter -- nichts anderes ist ja eine Suchmaschine -- könnte nur Trivialdaten liefern oder eine Kopie des Originals -- beides für den Suchenden nicht von Interesse.
Um wirklich semantisch suchen zu können -- der geneigte Student erlernt es meist als »Literaturrecherche« und »exzerpieren« -- muss die Maschine in der Lage sein, eine eigene mentale Repräsentation ihrer selbst und ihrer Umwelt aufzubauen. Sie benötigt also eine Identität, ein »Ich bin« und eine Repräsentation all dessen, was nicht »Ich« ist.
Dazu muss sie lernen können -- und ich meine hier nicht die simplen behavioristischen Lerntheorien a la »Lernen bedeutet langfristig die Änderung kortikaler Repräsentationen« (Manfred Spitzer - Lernen: Gehirnforschung und die Schule des Lebens (S. 183))«, sondern eher die Art von Lernen und Erkenntnis, die Jean Piaget in seiner genetischen Epistemologie beschrieben hat.
Die Suchmaschine muss ein Wissensnetz aufbauen, in das sie äussere Einflüsse assimiliert und das sie ggf. akkomodiert, also verändert. Um neues Wissen zu erwerben muss sie aber einen Grund dafür haben, also ein Motiv oder Motivation. Piaget sprach daher von der Äquilibration, also einer Art Ungleichgewicht zwischen wahrgenommener, äußerer Umwelt und repräsentierter, innerer Umwelt. Dieser Unterschied, koginitive Dissonanz genannt, führt eben zur Assimilation neuen Wissens oder aber zur Akkomodation (Veränderung, Anpassung) der inneren, repräsentierten Umwelt.
Nur mit diesem inneren Wissensnetz versehen, kann ein Mensch oder ein Computer überhaupt Texte »verstehen«, »sinnvoll interpretieren« oder eben auch »durchsuchen«.
Dies kann der Computer eben nicht, er kann nur eine Reduktion der Texte nach festgelegten Regeln liefern, sofern die Regeln deterministisch und determinierbar, also algorithmisierbar sind.
Diese (vereinfachten) Kopien der Realität werden unter dem Etikett »Objektivität« gerne gefordert, sind aber Erkenntnistheoretisch von fragwürdigem Nutzen bzw. wahrnehmungspsychologisch von Menschen nicht leistbar, wie Heinz von Foerster in seiner Kybern-Ethik bzw. Kybernethik zweiter Ordnung festgestellt hat.
Die Semantik eines Textes oder von Kommunikation liegt eben nicht im Datum, das in der Welt existiert, sondern in dessen Interpretation im Individuum.
Mir ist aber nicht bekannt, das ein Computer etwas möchte, also ein Motiv oder gar eine Motivation hat. Er ist genauso leb- und willenlos wie ein Hammer, eine Wasserpumpenzange, der Hilbertraum oder das Gaußsche Eliminationsverfahren. Eben nur ein Werkzeug, mit dem Menschen arbeiten können, aber nicht selbst in der Lage ist, die Welt zu interpretieren.
Fazit: Computer sind nicht in der Lage Texte zu interpretieren und werden es auch nie sein können. Ihnen fehlen einfach die Grundvoraussetzungen, sinnvolle Interpretationen zu liefern. Wären Sie dazu jemals in der Lage, dürften sich ihre Ergebnisse darüberhinaus nicht von denen von Menschen unterscheiden (vgl. Turing-Test).
Als weiterführende Literatur möchte ich unbedingt Joseph Weizenbaum Die Macht der Computer und die Ohnmacht der Vernunft, alles von Paul Watzlawick, Heinz von Foerster und Ernst von Glasersfeld sowie Piagets genetische Epistemologie empfehlen. Und natürlich die letzten Jahrtausende Philosophie.
wenn eine KI eine sinnvolle Interpretation von Moby Dick liefert. Bis dahin: Ein weiter Weg.
Ich enpfehle zusätzlich zur Lektüre: Wittgenstein, vorzugsweise vollständig.
_________________________________________________
In diesem Wahljahr werde ich mich für keine Partei
aussprechen und zu keinem Parteiprogramm. Aber ich
werde nicht aufhören, zu sagen, dass diese Krise eine
ideologische Heimat hat: die FDP.…
______
wenn eine KI eine sinnvolle Interpretation von Moby Dick liefert. Bis dahin: Ein weiter Weg.
Ich enpfehle zusätzlich zur Lektüre: Wittgenstein, vorzugsweise vollständig.
_________________________________________________
In diesem Wahljahr werde ich mich für keine Partei
aussprechen und zu keinem Parteiprogramm. Aber ich
werde nicht aufhören, zu sagen, dass diese Krise eine
ideologische Heimat hat: die FDP.…
______
wenn eine KI eine sinnvolle Interpretation von Moby Dick liefert. Bis dahin: Ein weiter Weg.
Ich enpfehle zusätzlich zur Lektüre: Wittgenstein, vorzugsweise vollständig.
_________________________________________________
In diesem Wahljahr werde ich mich für keine Partei
aussprechen und zu keinem Parteiprogramm. Aber ich
werde nicht aufhören, zu sagen, dass diese Krise eine
ideologische Heimat hat: die FDP.…
______
Semantische Suchmaschinen, die gut funktionieren, das ist ja eher Zukunftsmusik. Die Suche selbst ist schon gut, entscheidend ist doch die Darstellung der Ergebnisse. Eine gute Struktur, übersichtliche Ansicht mit Vorschaufenstern zu den einzelnen Ergebnissen, sowas gibt es jetzt: Wenn auch noch in der Beta Phase, ist www.mageleo.de ein Beispiel für erfolgreiches Finden, effizient und benutzerfreundlich.
Bitte melden Sie sich an, um zu kommentieren