Wie kann man sicher sein, daß keine Lügen und kein bedrohlicher Unsinn sich in den Tiefen dieses Aussagen-Ozeans angesammelt haben, die bei einem möglichen späteren Einsatz des Programms fatale Folgen haben könnten? In Fachkreisen ist das die Frage nach der sogenannten Evaluation der Wissensbasis – und weil diese Kontrolle bei Cyc schon ob der schieren Masse der Aussagen nicht mehr möglich ist, wird mancherorts eben die Nase gerümpft. Die Cyclists würden selbst nie behaupten, daß ihr Datenhaufen edel und widerspruchsfrei sei, denn exakt das ist ja sein Sinn: Er soll die Welt abbilden, wie sie ist.

Der allergrößte Teil der Cyc-Wissensbasis hat den Charakter von plausiblen Vermutungen und kann jederzeit durch neu eingegebene Sachverhalte falsifiziert werden. So ist sichergestellt, daß die Auferstehung eines Religionsgründers, die den bereits gelernten Regeln für das Menschenleben widerspricht, das Aufnahmevermögen der Technik nicht übersteigt.

Aussagen in Cyc sind also alles andere als unumstößlich. Organisiert sind sie in Gruppen zusammengehörenden Inhalts, in Cyc „Mikrotheorien“ genannt. Sie können miteinander konkurrieren. So existieren in Cyc mehrere medizinische Mikrotheorien parallel: naive, die in Kindermanier Symptome und Krankheiten gleichsetzen, und ausgefeilte, die dem medizinischen Denken von Ärzten nachgebildet sind. Bei Anfragen an seine Wissensbasis muß das Programm entscheiden, welche Mikrotheorie ihm am ehesten zum Verständnis hilft.

Gemäß Zeitplan ist der Punkt nahe, an dem die Wissensaufnahme von Cyc weitgehend automatisiert abläuft; wie weitgehend tatsächlich – auf solche Fragen sind konkrete Antworten von den Forschern nicht zu bekommen. Englische Texte kann Cyc interpretieren; Syntax und Wortschatz reichten aus, um den größten Teil einer einfachen Tageszeitung wie etwa USA Today zu analysieren, versichert Douglas Lenat. Cyc wisse genug, um aus den Texten selbständig zu lernen, ein Mensch müsse nur „gelegentlich“ bei Verständnisproblemen konsultiert werden.

Wozu das ganze? Schon der Ernst, mit dem banale Daten aufgehäuft werden, deutet an, daß hinter Cyc mehr steckt als nur Forscherdrang. Als selbständiges Programm ist Cyc auch ziemlich sinnlos – schließlich soll es abbilden, was der durchschnittlich Gebildete ohnehin weiß. Zur intelligenten Konversation wird man es nicht wählen.

Cyc soll sein Wissen vielmehr für andere Computerprogramme bereitstellen, unter deren Stumpfheit wir leiden. Im Prototyp hatte solche Zusammenarbeit schon Erfolg; in Systemen, die gerade entstehen, können beispielsweise Datenbanken und Tabellenkalkulationen, die Arbeitspferde betrieblicher Datenverarbeitung, mit Alltagswissen ausgestattet die Eingaben von Benutzern auf ihren Sinn prüfen. 11,65 Mark in einem Feld fürs Monatsgehalt würde zumindest Cyc nicht sehr plausibel finden. Das Programm könnte auch mit Hilfe seiner sprachverstehenden Komponente (die in Zusammenarbeit mit Apple entwickelt wird) Benutzerfragen aufnehmen und an andere Programme weitergeben.

Die möglicherweise erste marktreife Anwendung soll Cyc als Oberfläche für Bild- oder Videodatenbanken nutzen. Auf die Frage „Bitte ein Bild zu Risikofaktoren für Hautkrebs“ könnte das System ein Photo mit dem Titel „Jahr für Jahr knappere Tangas am Strand von Rio“ liefern. Anfrage und Ergebnis haben kein Wort gemeinsam, Cyc würde die Zusammenhänge aber erkennen.