Die kulturelle Entwicklung des Menschen vollzieht sich im Vergleich zur natürlichen Evolution der Arten in hohem, sich immer noch beschleunigendem Tempo. Nachdem das Größenwachstum des menschlichen Gehirns aufgehört hatte, sind kulturelle Lernprozesse an die Stelle der genetischen Anpassung getreten. Was anderen Tierarten fehlt, ist die generationenübergreifende Weitergabe symbolisch gespeicherten Wissens, das im Lichte neuer Erfahrungen revidiert und erweitert wird. Der Schimpansenforscher und Entwicklungspsychologe Michael Tomasello, der die gut erforschte Ontogenese als Schüssel für die Aufklärung der immer noch rätselhaften Phylogenese des Menschen benutzt, ist von diesem Phänomen ausgegangen. Zunächst hat er die sozialkognitiven Fähigkeiten, die für die Ausbildung und Umbildung von Traditionen nötig sind, an ihren frühkindlichen Wurzeln untersucht – dort also, wo Mütter ihre Kinder auf Objekte hinweisen, um ihnen etwas beizubringen.

Bereits in diesem vorsprachlichen Alter folgen ungefähr einjährige Kinder der Zeigegeste von Bezugspersonen und benutzen selber den Zeigefinger, um mit anderen ihre Wahrnehmungen zu teilen. Am Funktionieren dieser einfachen Geste entdeckte Tomasello eine triadische Beziehung, für die es bei Schimpansen keine Entsprechung gibt. Auf der horizontalen Ebene übernehmen die Beteiligten mit der Blickrichtung auch die Intention des jeweils anderen, sodass eine soziale Perspektive entsteht, aus der beide in vertikaler Richtung ihre Aufmerksamkeit zugleich auf das angezeigte Objekt richten. Auf diese Weise gewinnen sie von dem gemeinsam identifizierten und wahrgenommenen Gegenstand ein intersubjektiv geteiltes Wissen. Alsbald kommen nachahmende Gebärden für die Repräsentation von Gegenständen, auch von Objekten außerhalb der Sichtweite des Kindes, hinzu. Auf diesem Wege kann sich sukzessive ein gemeinsames Hintergrundwissen aufbauen, auf das sich die erweiterte Gestenkommunikation stützt.

Offenbar bildet sich mit den in kommunikativer Absicht ausgetauschten Gesten beides gleichzeitig aus: die intersubjektive Beziehung zu anderen Personen und die intentionale Bezugnahme auf etwas in der objektiven Welt. Das scheint auch der sozialkognitive Kern für den Gebrauch einer grammatischen Sprache zu sein, die zugleich der Kommunikation miteinander und der Darstellung von etwas dient.

Diese Einsicht hat jedenfalls für jene einfallsreichen experimentellen Vergleiche des problemlösenden Verhaltens von Kindern und Schimpansen die Weichen gestellt, die Michael Tomasello und dessen Mitarbeiter seit etwa zehn Jahren am Leipziger Max-Planck-Institut für evolutionäre Anthropologie durchführen. Aus den ingeniösen Forschungen ist ein bahnbrechendes, vorzüglich ins Deutsche übersetztes Buch über Die Ursprünge der menschlichen Kommunikation hervorgegangen. Im Hinblick auf die sozialkognitiven Fähigkeiten, die Homo sapiens für die Herausbildung von Kultur und Gesellschaft im Laufe der langen Periode der Hominisierung erworben haben muss, klafft ja zwischen der ersten, durch Gesten vermittelten gemeinsamen Wahrnehmung und einer vollständig ausgebildeten soziokulturellen Lebensform eine große Lücke. Ungelöst ist immer noch das uralte Problem, an dem sich auch die Philosophie spätestens seit Herder die Zähne ausbeißt: Wie die Sprachen entstanden sind, die eine uns geläufige kommunikative Handlungskoordinierung und arbeitsteilige Kooperation möglich gemacht und damit einen völlig neuen Modus der Vergesellschaftung ins Leben gerufen haben.

Um eine solche interdisziplinäre Fragestellung anzugehen, ist die Zusammenführung der Entwicklungspsychologie mit Sprachforschung auf der einen, Primatenforschung auf der anderen Seite hilfreich. Hinsichtlich der linguistischen Seite wählt Tomasello keinen leichten Weg. Alle bekannten Umgangssprachen besitzen Grammatiken, die so kompliziert sind, dass das außerordentliche Tempo des kindlichen Spracherwerbs kaum als ein kontinuierlicher Lernvorgang vom Einfachen zum Komplexen zu erklären ist. Jedenfalls schien Chomskys durchschlagende Kritik an Skinners behavioristischer Theorie des Spracherwerbs Mitte der sechziger Jahre eher für die Annahme angeborener Mechanismen zu sprechen. Das erklärt einerseits den großen Erfolg der universalistisch angelegten transformationsgrammatischen Ansätze in der Linguistik, andererseits die anhaltende Suche nach den genetischen Grundlagen der Sprache in der Biologie.

Im Gegensatz dazu greift Tomasello auf die alte Theorie des Ursprungs der Sprache aus der Gestenkommunikation zurück. Damit nimmt er eine erhebliche Begründungslast in Kauf. Er muss die Struktur der Sprache auf die grammatische Verknüpfung einfacher semantischer Konventionen zurückführen und diese wiederum auf die Konventionalisierung von nicht vokalen Gesten, die eine evolutionär vorteilhafte Form der Kooperation ermöglichen. Der sozialpragmatische Ansatz erklärt nämlich die Entstehung der Sprache funktional aus der Lösung jener allgemeinen Kommunikationsaufgaben, die sich in kooperierenden Gruppen aus Problemen der Handlungskoordinierung ergeben.

Während die Ausführungen zur Grammatikalisierung im vorletzten Kapitel des Buches eine Skizze bleiben, verfügt Tomasello über gute Argumente für die These, dass sich die menschliche Kommunikation überhaupt aus der Gestenkommunikation entwickelt hat. Ontogenetisch fällt ins Gewicht, dass sich Kleinkinder über Gesten verständigen, bevor sie sprechen lernen; das Gleiche tun auch gehörlose Kinder, die nicht im Kontakt mit Sprechern aufwachsen. Phylogenetisch bieten die nicht vokalen Gebärden von Schimpansen, vor allem jene Aufmerksamkeit heischenden Gesten, die erlernt und flexibel angewendet werden, einen plausiblen Anknüpfungspunkt für die Evolution der menschlichen Kommunikation. Aus der Kombination von Zeigegesten und Nachahmungsgebärden könnten sich auch die beiden Komponenten der wichtigen Aussagestruktur entwickelt haben – die bezugnehmenden und die prädikativen Ausdrücke.

Mit dem sozialpragmatischen Ansatz lenkt Tomasello die Kognitionsforschung in eine andere Richtung, als es das heute vorherrschende Paradigma nahelegt. Er nimmt Wittgensteins Einsicht ernst, die Hilary Putnam auf den Punkt bringt, dass Bedeutungen nichts sind, was »in einem einzelnen Kopf steckt«. Hingegen scheinen Schimpansen nicht aus den Schranken ihrer selbstbezogenen, von jeweils eigenen Interessen gesteuerten Sicht ausbrechen zu können. Sie sind zwar außergewöhnlich intelligent und können intentional handeln, die Intentionen eines Artgenossen verstehen und die räumliche Differenz ihrer Standorte richtig einschätzen, sogar praktische Schlüsse daraus ziehen. Aber sie können keine interpersonale Beziehung mit einem anderen eingehen. Aus sozialpragmatischer Sicht besteht die entscheidende evolutionäre Errungenschaft in der komplexen Fähigkeit, sich auf einen Artgenossen so einzustellen, dass beide in der gestenvermittelten Bezugnahme auf objektive Gegebenheiten dieselben Ziele verfolgen, also kooperieren können.

Im einfachsten Fall läuft die Kommunikation über eine Zeigegeste, mit der auch in der Ontogenese jene auffällige Verschränkung von Kognition und Verständigung einsetzt, durch die sich die menschliche Kommunikation auszeichnet. Mit der kommunikativen Vergesellschaftung des tierischen Bewusstseins sind die sozialkognitiven Ausgangsbedingungen für eine von genetischer Anpassung entkoppelten kulturellen Entwicklung erfüllt. An dieser Schwelle erweitert sich nämlich die selbstbezogene Intentionalität des einzelnen Artgenossen zum extended mind von Teilnehmern an gemeinsamen Praktiken.

Die triadische Beziehung, an der sich die Gleichursprünglichkeit von Intersubjektivität und Objektivität ablesen lässt, ist auch philosophisch von besonderem Interesse. Je nachdem, wie man diese Perspektivenverschränkung begrifflich analysiert, wird man auch die evolutionäre Geschichte, an der Tomasello interessiert ist, anders erzählen.

Für das Zustandekommen einer kommunikativen Beziehung zwischen Sprechern halten »Intentionalisten« wie Paul Grice und John Searle das rekursive Erkennen von Intentionen (»Ich weiß, dass er weiß, dass ich weiß…«) für nötig. Nach dieser Lesart kann auch eine primitive Zeigegeste erst auf der Grundlage »wechselseitigen Wissens« funktionieren. Erst der von gemeinsamer Aufmerksamkeit gesteuerte Aufbau geteilten Wissens soll die kommunikative Verwendung und das Verstehen von Zeichen ermöglichen. In der entsprechenden evolutionären Geschichte muss dann aber erklärt werden, wie rekursives Erkennen seinerseits entsteht. Dazu bemüht Tomasello die bei Homo sapiens besonders ausgeprägten »prosozialen« Neigungen zu »Helfen« und »Mitteilen«. Allerdings könnten die kooperative Natur und die Geschwätzigkeit unserer Spezies ebenso gut die Folge der Umstellung auf einen kooperativen Vergesellschaftungsmodus und der damit entstehenden reziproken Abhängigkeiten sein.

Die evolutionäre Geschichte müsste etwas anders erzählt werden, wenn man davon ausgeht, dass für die ursprüngliche kommunikative Verwendung von Gesten kein anspruchsvolles rekursives Erkennen nötig ist. Symbolen sieht man gewissermaßen ihre Kommunikationsfunktion an. Wer Symbole verwendet, äußert in einem mit deren semantischem Gehalt eine kommunikative Absicht. Auch dem Kind kommt diese Absicht als solche erst im Verlaufe des Spracherwerbs so weit zu Bewusstsein, dass es dann – mithilfe »rekursiven Erkennens« – in der Lage ist, einen Partner zu täuschen.

Nach dieser Lesart wären es die anfänglichen Gesten selber, die die gemeinsame Aufmerksamkeit auf dasselbe Objekt lenken und ein gemeinsames Wissen von diesem stimulieren. Erst die Verbindung von Kognition und Kommunikation würde für die Beteiligten die intersubjektiv geteilte Welt konstituieren, worin diese sich miteinander über etwas verständigen können. Der evolutionär entscheidende Schritt wäre mithin unmittelbar die Integration der bis dahin selbstbezogenen Intentionalität mit einer von ihrer genetischen Fixierung sich ablösenden Gestenkommunikation. Im Prozess dieser Verschmelzung würden die kommunizierten Zeichen mit intersubjektiv geteilten Bedeutungen belehnt – und tierische Gesten in symbolische umfunktioniert.