Psychologen, Linguisten und Anthropologen erkennen immer genauer, wie Kinder sprechen, lernen

Von Dieter E. Zimmer

Der ägyptische König Psammetich machte vor zweieinhalb Jahrtausenden ein wissenschaftliches Experiment – eins von der Art, die sich der modernen Verhaltensforschung verbieten. Er wollte herausfinden, welches die Ursprache der Menschheit sei. Dazu ließ er zwei neugeborene Kinder in der Wildnis aussetzen. Welche Sprache würden sie von sich aus entwickeln? Nach zwei Jahren wurden sie zurückgeholt. Sie sagten bek bek – vermutlich ahmten sie nur das Meckern der Ziegen nach, ihrer einzigen Gefährten bis dahin. Für den königlichen Psycholinguisten war die Frage damit entschieden: „Bekos“ bedeutete auf Phrygisch soviel wie „Brot“. Die Ursprache der Menschheit mußte somit das Phrygische sein.

Die Frage nach dem Ursprung der Sprache hat die Menschheit seitdem nicht losgelassen; um wenig andere hat sie sich so viele Gedanken gemacht. Und zwar um den Ursprung im doppelten Sinn: Wie erwirbt der einzelne seine Sprache? Und woher hat die Gattung Mensch sie? „Im Anfang war das Wort“, spricht der Evangelist Johannes: Die Sprache erschien als das Allermenschlichste, Allergöttlichste. 1769 gewann Herder den Wettbewerb der Preußischen Akademie der Wissenschaften mit einem Essay, in dem er argumentierte, daß die Sprache kein göttliches Geschenk, sondern eine menschliche Erfindung sei. Danach schossen die Spekulationen über die Sprachentstehung ins Kraut.

Es entstanden ungezählte, teils gelind absurde Theorien, später meist auf farbige Spitznamen getauft. Die Wauwau-Theorie: Ihr zufolge ahmte die menschliche Sprache in ihrem Ursprung natürliche Laute nach, zum Beispiel Hundebellen. Die Aua-Theorie: Sprache wäre aus stark gefühlsbetonten Ausrufen hervorgegangen. Die Hauruck-Theorie: Am Anfang der Sprache stünden die Ausrufe bei gemeinsamer anstrengender körperlicher Arbeit. Die Bimbam-Theorie: So wie jedes Ding eine natürliche Resonanz habe, so bringe auch jeder Eindruck im Kopf einen charakteristischen Laut hervor. Die Tata-Theorie: Die Zunge mache die Handbewegungen der Gebärdensprache (etwa des Winkens) nach. Die Trarabumm-Theorie: Sprache habe mit rituellen Tänzen und Beschwörungen begonnen. Sie alle und viele mehr hatten denselben Fehler: Sie konnten ebensogut richtig wie falsch sein. Vielleicht gerade darum war die „Glottogenese“, die Sprachentstehung, das Lieblingskind der Spekulierer. Die Pariser Sprachgesellschaft erwehrte sich ihrer, indem sie 1866 in ihren Statuten die Annahme von Sprachentstehungstheorien (sowie von Vorschlägen für Weltsprachen) rundheraus verbot Aber so sehr die glottogeneosche Spekulation unter Wissenschaftlern auch in Verruf geriet: die Menschen konnten es niemals, lassen.

Die betroffenen Wissenschaften selbst – Psychologie, Linguistik, Anthropologie, Medizin, Biologie – steckten zurück und setzten sich bescheidenere Ziele. Auf der ganzen Welt wurden Kinder mit Notizblock und Recorder belauscht. Ingeniöse Spiele wurden erdacht, um ihre Sprachbeherrschung zu testen. Schädelanatomien wurden minuziös verglichen. Es entstand, von der Öffentlichkeit unbemerkt, besonders in den letzten zehn, fünfzehn Jahren eine unabsehbare, zum Teil hochabstrakte Literatur zum Thema Spracherwerb. Die Antwort auf die große, allgemeinste Frage nach dem Woher der Sprache enthält sie noch nicht, und kaum eine ihrer Hypothesen bleibt unwidersprochen. Aber andererseits ist unsere Ignoranz auch nicht mehr vollständig. Auf etliche Fragen gibt es inzwischen Antworten, vielleicht nicht endgültige, aber plausible. Einige sollen hier skizziert werden.

Daß Kindersprache einfach eine unvollkommene, beliebig entstellte Erwachsenensprache sei: das war eine der Vorstellungen, von denen Abschied genommen werden mußte.

Kinder erlernen ihre Muttersprache offenbar in bestimmten Phasen, und das auf Grund einer Strategie, die weltweit gültig ist. Diese natürliche Strategie läßt sich durch Unterrichtsmethoden nicht nennenswert ändern; sie läßt sich auch so gut wie nicht beschleunigen oder verlangsamen, sie ist weitgehend immun gegen erzieherische Eingriffe. Auf Berichtigungen ihres Sprechens achten Kinder kaum. Auch wenn Kinder oft unvollkommene oder schadhafte Sprache zu hören bekommen, erwerben sie doch die Fähigkeit, eine beliebige Zahl richtiger Sätze zu bilden. Eine Sprache, die doch ein ungeheuer kompliziertes Regelsystem ist, wird auch von minderintelligenten Kindern wie von selbst, mühelos, mit Begierde und unbewußt aufgesogen – die-, entsprechenden Regeln zu formulieren, überstiege die Fähigkeiten aller Kinder bei weitem; selbst die Erwachsenen haben meist eine lebenslange Abneigung gegen die Formulierung der grammatischen Regeln, die sie doch ständig befolgen.

Der Erwerb einer primären Sprache ist grundverschieden von dem späteren Fremdsprachenlernen: schneller, müheloser, gründlicher. Spracherwerb ist kein bewußtes Training; er ist auch nur im allerallgemeinsten Sinn Imitation. Mit zwei Jahren sind gerade 20 Prozent der kindlichen Äußerungen Nachahmungen des Gehörten; mit drei Jahren gar nur noch zwei Prozent. Entscheidend für den Spracherwerb ist die Interaktion; bis zum dritten Lebensjahr hauptsächlich mit den Eltern, von da an zunehmend mit Gleichaltrigen. Kinder taubstummer Eltern, die mit ihnen in Zeichensprache redeten und darüber hinaus gesprochene Sprache (etwa im Fernsehen) wohl hörten, aber nicht selber sprachen, lernten Zeichensprache; sprechen lernten sie nicht. Die vielen Warum-Fragen, die Kinder in endloser Folge stellen, sollen offenbar weniger Gründe erforschen als vielmehr das Gespräch in Gang halten.

Der Spracherwerb geht relativ schnell vonstatten. Das Kind beginnt mit etwa 18 Monaten zu sprechen. Die schnellste Erweiterung seines Wortschatzes, von unter 500 auf über 1200 Wörter, findet zwischen zweieinhalb und dreieinhalb Jahren statt. Mit fünf Jahren hat das Kind die Grundregeln seiner Sprache erworben und dazu die wichtigsten ihrer Ausnahmeregeln. Mit der einsetzenden Pubertät ist der Spracherwerb im wesentlichen abgeschlossen; wer bis dahin keine primäre Sprache erlernen konnte, wird sie niemals mehr lernen.

Ein besonders erschütterndes Beispiel dafür ist das Mädchen Genie, das seit ihrem zwanzigsten Monat gefesselt und isoliert in einer Kammer gefangen gehalten wurde und nicht nur ohne sprachlichen Kontakt aufwuchs, sondern von ihrem Vater und ihrem älteren Bruder angebellt wurde und deren eigene Lautäußerungen der Vater regelmäßig bestrafte. Als sie in Kalifornien 1971 mit 14 Jahren aufgefunden wurde, verstand sie keine Sprache und lernte sie viel langsamer als ein Kleinkind; soweit von ihren Fortschritten berichtet wurde, brachte sie es überhaupt nur zu primitiven Kurzsätzen. Ihren Fall vergleiche man mit dem der Helen Keller, die mit 19 Monaten durch eine Meningitis blind und taub wurde, anfangs sprachlos (oder vielmehr: mit einer selbstgemachten Zeichensprache) aufwuchs, mit sieben an eine geniale Hauslehrerin geriet, die sofort begann, ihr Wörter in die Hand zu schreiben. Ihr Spracherwerb war wie eine Implosion: Nach zwei Monaten kannte sie 200 Wörter, nach drei Monaten begann sie erste Briefe zu schreiben, und nach wenigen Jahren war ihre Sprache (die für sie gleichzeitig das Sinnesorgan war, über das sie sich ihr Wissen über die Außenwelt aneignete) differenzierter als die der meisten Gleichaltrigen.

Kaum noch angefochten ist heute die Meinung des amerikanischen Psychologen Eric Lenneberg:

„Wir müssen annehmen, daß das Vermögen des Kindes, Sprache zu lernen, eine Folge der Reifung ist, denn (1) die Entwicklungsstufen des Spracherwerbs sind gewöhnlich mit anderen Entwicklungsstufen verschränkt...; (2) diese Gleichzeitigkeit wird häufig auch dann bewahrt, wenn der gesamte Reifungsplan sich drastisch verzögert...; (3) es gibt keine Anzeichen dafür, daß intensiver Unterricht höhere Stufen der Sprachentwicklung zur Folge hat.“

Das vorsprachliche Kind

Während Lenneberg 1967 noch davon ausging, daß der Spracherwerb erst im zweiten Lebensjahr einsetzte und davor nichts für die Sprachentwicklung Wichtiges geschehe, wurde seitdem nachgewiesen, wie wichtig auch und gerade diese vorsprachliche Phase ist.

Die Sprachentwicklung scheint sich schon im Mutterleib vorzubereiten. Sprache wird (bei Rechtshändern jedenfalls) in der linken Großhirnrinde verarbeitet. Die beiden Hirnhemisphären sind anatomisch nicht symmetrisch. Diese Hemisphärenspezialisierung beginnt nicht, wie man noch bis vor kurzem annahm, erst mit dem zweiten Lebensjahr: Sie ist schon beim 20 Wochen alten Embryo sichtbar, und schon das vorsprachliche Kind reagiert links auf sprachliche und rechts auf nichtsprachliche Reize.

Unmittelbar nach der Geburt kann das Kind bereits Sprache von anderen Geräuschen unterscheiden. Mit zwei Monaten unterscheidet es bekannte und unbekannte Stimmen, Männer- und Frauenstimmen, die Intonationen der Freude und der Wut, steigende und fallende Satzmelodien (einige Autoren meinen: Frage und Feststellung). Möglicherweise verfügt derMensch über besondere „Detektoren für sprachliche Charakteristika“, die ihn von Anfang an instand setzen, Sprache zu erkennen und in ihre Einheiten zu zerlegen. Zwischen dem sechsten und zwölften Monat werden die Babbel- und Gurrlaute des Kindes melodisiert und rhythmisiert: Es entsteht seine „Kommunikationsstimme“. Nach dem achten Monat etwa beginnt es die mütterliche Sprachmelodie (Prosodie) nachzuahmen; in der Regel wird es keine zweite Sprache im Leben so perfekt lernen wie die Muttersprache, deren Prosodie es in seinen ersten Lebensmonaten ausgesetzt war. Ebenfalls mit etwa acht Monaten beginnt es mit seinen Lautverdoppelungen (Reduplikationen): Es sind in allen Sprachen dada, bana, mama, tata, nana, papa. (Im Georgischen beispielsweise wird später mama Vater und dada Mutter bedeuten.) Nachdem es – in der Phase der Echolalie – zunächst die Laute der Mutter nachgeahmt hat, beginnt es nach dem achten Lebensmonat, seine eigenen Laute zu imitieren, also sich eine Verknüpfung zwischen Hören und Sprechen zu schaffen. Zwischen dem zwölften und dem 18. Monat tauchen die ersten wortartigen Gebilde auf: Und immer geht dabei das Verstehen der eigenen Hervorbringung voraus.

Es ist, als übte das Kind im ersten Jahr die Beherrschung der über 100 Muskeln, die an den Veränderungen des Stimmtrakts mitwirken, für ihre spätere Aufgabe ein. Sein Lautrepertoire ist noch sehr groß. Es verringert sich, sobald die eigentliche sprachliche Phase beginnt, auf die 20, höchstens 40 Lauteinheiten (Phoneme) seiner Muttersprache.

Die Sprache wächst

Irgendwann zwischen dem zwölften und 18. Monat erscheint dann das erste wortartige Gebilde unter den Lauten des Kindes. Und zwar verhält es sich keineswegs so, daß es aus seiner Umwelt irgendeinen interessanten Menschen oder Gegenstand auswählt und nun lernt, wie der zu benennen wäre. „Anfangs spricht das Kind kein bestimmtes ,Wort‘ aus; vielmehr greift der Erwachsene aus seinen Zufallsproduktionen gewisse heraus und bringt das Kind dazu, sie zu wiederholen, zu isolieren und mit etwas zu assoziieren“ (die Phonetikerin Gabrielle Konopczynski von der Universität Besançon).

Bei allen Kindern aller Sprachen beginnt die eigentliche sprachliche Phase mit den Einwortsätzen, den sogenannten Holophrasen. Schon die Hamburger Psychologen Clara und William Stern haben in ihren Pionieruntersuchungen zu Beginn dieses Jahrhunderts erkannt, daß diese Einwortsätze eben nicht einzelne Wörter wie in der Erwachsenensprache sind. Wauwau bedeutet nicht einfach Hund; es kann heißen: da ist ein Hund; ich will den Hund streicheln; ich habe Angst vor Hunden – und vieles mehr. Jedes solche Wort hat den Wert eines Satzes.

Das Kind ist zwar schon damit beschäftigt, die Sprache, die es Hört, syntaktisch zu analysieren. Es kann jedoch selber noch keine zwei Worte syntaktisch verbinden. Statt dessen muß es sich mit der „vertikalen“ Reihung von Einwortsätzen begnügen. Kind: Auto. Auto. Auto. Erwachsener: Was? Kind: Fahrn. Fahrn. Bus. Bus. Bus. Erwachsener: Was? Fahrrad? Hast du das gemeint? Kind: Nicht. Erwachsener: Nein? Kind: Nicht. Was dies Kind ausdrücken wollte, hätte ein Erwachsener mit seiner Syntax „horizontal“ so gesagt: „Das Auto, das ich da eben gehört habe, erinnert mich daran, daß wir gestern Bus gefahren sind und nicht Fahrrad.“

Was das Kind vollziehen muß, das sich anschickt, eine Syntax zu entwickeln, sind zwei gegenläufige Geistesbewegungen: Die eine ist analytisch und zerlegt die Welt in lauter einzelne Dinge und Vorgänge, die alle ihre besonderen Namen tragen; die zweite ist synthetisch und bündelt die Einzelheiten mit Hilfe der Syntax zu übergreifenden Sinneinheiten.

Zwischen zwölf und 18 Monaten gebraucht das Kind zehn bis 50 Einwortsätze. Dann folgt, ebenfalls bei allen Kindern der Welt, die Zweiwortphase: Buch da; Kaffee nein; kuckuck wauwau.

In den sechziger Jahren glaubte der amerikanische Linguist Martin Braine die Grammatik entdeckt zu haben, die diese Zweiwortsätze regiere. Es war die sogenannte Pivot-Grammatik. Danach unterschiede das Kind zwei Klassen von Wörtern: die sogenannten Pivot-(oder Drehpunkt-)Wörter, inhaltsschwer, wenig an Zahl; und die „offenen“ Wörter, deren Zahl rasch zunimmt. Die Zweiwortsätze beständen immer aus einem Pivot und einem offenen Wort, manchmal auch aus zwei offenen, aber niemals aus zwei Pivots. In vielen Lehrbüchern wird diese Grammatik bis heute fortgeschrieben, obwohl der bedeutendste Fachmann für Kindersprache, der verstorbene Psychologe Roger Brown von der Harvard-Universität, schon Anfang der siebziger Jahre darauf kam, daß sie auf viele kindliche Äußerungen dieser Phase einfach nicht paßt und darum als unzulänglich verworfen werden muß.

Eine eigene Dreiwortphase gibt es nicht mehr. Aber ständig werden die Sätze länger und komplexer; die „mittlere Äußerungslänge“ ist nach Roger Brown das sicherste Indiz für den Stand der kindlichen Sprachentwicklung.

Worüber sprechen Kinder? Die New Yorker Kindersprachforscherin Lois Bloom schreibt:

„Zuerst sprechen Kinder über die Beziehungen der Dinge zueinander; sie weisen nicht einfach auf die Dinge hin oder nennen ihre Namen, Die Relationsinformation, über die Kinder sprechen, hat mit dem Vorhandensein, Verschwinden, Nichtvorhandensein. Wiedererscheinen eines Dings zu tun (also der Beziehung eines Dings zu sich selber); den Handlungen von Personen, die die Dinge betreffen; dem Ort, an dem sich Dinge und Menschen befinden; den Dingen, die Im Besitz oder sonstwie im Bereich anderer Menschen sind... Von entscheidender Bedeutung in der frühen Kindersprache ist die Bewegung – unter den ersten Ding-Wörtern, die die Kinder lernen, sind die Namen beweglicher Objekte (etwa Menschen, Haustiere, Bälle), und die semantisch-syntaktischen Mittel werden für die Bezeichnung von Aktionsereignissen benutzt, ehe sie für statische Ereignisse verwendet werden. In bezug auf Bewegung sprechen Kinder fast immer nur über ihre eigenen Handlungsabsichten, etwa ‚Keks essen‘, oder über ihren Wunsch, daß andere für sie handeln, etwa ‚Mama auf‘, während das Kind der Mutter eine Schachtel reicht, die sie öffnen soll.“

Jenseits der Zweiwortphase beginnt die Notwendigkeit, Sätze hierarchisch zu strukturieren: Das Kind betritt das Reich der Syntax. Jetzt stellt sich ihr universales Grundmuster ein. Die Sprachwelt teilt sich in Dinge und Handlungen, dann in den Handelnden, die Handlung und dasjenige, dem die Handlung zustößt; aus den Zweiwortverbindungen Papa schieben, schieben Auto und Papa Auto wird Papa schieben Auto – Subjekt, Prädikat, Objekt in der Beschreibungsweise der traditionellen Grammatik.

In diesem Stadium ist die Kindersprache noch reich an befrachteten „Inhaltswörtern“ und arm an „Funktionswörtern“. Sie wurde darum von Brown treffend „telegraphische Rede“ genannt. Wie dieser fehlen ihr noch weitgehend Konjunktionen, Präpositionen, Artikel und Flexionsendungen.

Wie lernen Kinder Bedeutungen? Eve Clark, Psycholinguistin an der Stanford-Universität, hat dazu eine interessante Hypothese entworfen. Die Bedeutung eines Wortes ist kein Ganzes; sie besteht aus einer Anzahl von Atomen (features). Das Kind lernt anfangs nur ein oder zwei dieser Features, mit der Folge, daß es die Wortbedeutung zunächst weit überdehnt. Lernt es etwa Wauwau, so mag es aus all dem, was einen Hund ausmacht, nur das Feature „Felliges“ herausgreifen und folglich das Wort Wauwau selber für alle Felltiere, aber auch auf Stofftiere oder Pelzmäntel oder Hausschuhe anwenden. Erst indem weitere Wörter gelernt werden, werden weitere Features: hinzugefügt, so daß die Überdehnung langsam zurückgenommen wird und die Bedeutung sich der Erwachsenenbedeutung nähert. So mag das Hinzukommen von Miau die Bedeutungsgruppe „kleine Felltiere“, das Hinzukommen von Hottehü die der „großen Felltiere“ übernehmen.

Ein interessanter Fall von Überdehnung ist der, daß für viele Kinder um dreieinhalb Jahre mehr und weniger gleichbedeutend sind. Offenbar erfassen sie zunächst die beiden Wörtern gemeinsamen semantischen Features „Menge“ und „anders“ und fügen das Feature „groß“ oder „klein“ erst später hinzu.

Die Überdehnung scheint überhaupt eins der universalen Grundprinzipien des Spracherwerbs zu sein, nicht nur für die Semantik, auch für die Syntax. Die Kinder versuchen der gehörten Sprache Regeln zu entnehmen und verallgemeinern sie versuchsweise in ihren eigenen Sprachproduktionen. Im Englischen werden Plurale bis auf wenige Ausnahmen mit der Endung -s gebildet. Ein Kind mag zunächst durchaus gelernt haben, daß der Plural von foot (Fuß) feet heißt: Sobald es die s-Regel erkannt hat, wird es scheinbar zurückfallen und den regelmäßigen, aber falschen Plural foots bilden – bis es sich auch noch die Ausnahme feet aneignet. Die völlig unregelmäßigen deutschen Pluralbildungen wie die vielen Unregelmäßigkeiten der deutschen Verben erlauben dem Kind keine praktische Regelhypothese. Es wird dennoch Versuche machen: Onkels (wie Autos), Katze (wie Hände), Schafen (wie Bauern), logte (für lag) – es hilft ihm nichts, es muß alle Plurale und alle Verbzeiten einzeln lernen; erst mit vier Jahren ist es darin einigermaßen sicher.

Sehr früh, etwa mit anderthalb Jahren, beginnt das Kind mit der Verneinung. Henning Wode von der Universität Kiel hat beobachtet, wie die Negation im Deutschen erworben wird. Zunächst erscheint die Einwortverneinung, irgendeine lautliche Ableitung von nein. Dann tauchen Zweiwortverneinungen vom Typ „nein, Zucker“ auf (mit dem Sinn: das ist Zucker und nicht Salz). Dieses nein wird überdehnt, um Verneinungen vom Typ nein hauen (für: nicht hauen) zu bilden; erst später wird die Bedeutung dieses nein von dem nicht der Erwachsenensprache übernommen. Dieses muß dann noch richtig in die Wortfolge eingeordnet werden, und es müssen zusätzliche Sonderfälle wie kein, nie hinzukommen.

Jenseits des fünften Lebensjahrs wird nicht nur der Wortschatz weiter angereichert, kommen nicht nur grammatische Seltenheiten hinzu. Das Kind geht von der Koordination zur Subordination über – es erscheinen Relativsätze: Aus Der Junge hat das Mädchen geschubst und ist weggerannt wird Der Junge, der das Mädchen geschubst hat, ist weggerannt. Es lernt überflüssige Markierungen zu vermeiden, also ökonomischer zu sprechen (Sätze wie Das Mädchen hat den Hund geschubst, und dann hat der Junge auch noch denselben Hund geschubst werden vereinfacht). Es lernt, daß einzelne Wörter mehrere Funktionen haben können: etwa daß der Artikel die in die Autos nicht nur mehrere Autos sondern auch alle Autos heißen kann. Es geht von der gesunden Grundregel ab, daß das Nomen am Anfang des Satzes immer auch der „Agent“ der Handlung ist, von der der Satz spricht; damit kann es Passivkonstruktionen lernen (ich lutsche den Bonbon wird transformierbar zu Der Bonbon wird von mir gelutscht). Und zwar werden die unumkehrbaren Passive früher gelernt als die umkehrbaren: Der Stein wird vom Jungen geworfen wird schneller richtig verstanden als Irene wird von Dieter gemocht (denn der Satz Der Junge wird vom Stein geworfen ist undenkbar; Dieter wird von Irene gemocht nicht), Mit etwa acht Jahren wird das Kind zu rein innersprachlichen Bezügen fähig: Das Mädchen... sie hat wird nun abgelöst von Das Mädchen... es hat. So jedenfalls beschrieb Annette Karmiloff-Smith von der Universität Genf kürzlich die Hauptkennzeichen der anschließenden Sprachentwicklung.

Wie Roger Brown es in Hinblick auf die Frühphasen des Spracherwerbs formulierte: „All dies macht natürlich einen sehr ,biologischen‘ Eindruck, fast als teilten sich semantische Zellen von einer begrenzten Typenzahl und verschmolzen und teilten sich erneut und verschmolzen wieder, und das in einer Art und Weise, die der ganzen Gattung Mensch gemeinsam ist.“

Zurück zum Ursprung

Die große Hoffnung der Sprachwissenschaft des 19. Jahrhunderts, durch die historische Grammatik immer frühere Sprachzustände zu erschließen und so vielleicht bis zur Ursprache zurückzugelangen, hat sich nicht erfüllt: Auch die kühnsten sprachhistorischen Kombinationen reichen höchstens etwa 10 000 Jahre zurück, während das Alter der menschlichen Sprache auf 40 000 bis 4 Millionen Jahre geschätzt wird. Auch die Hoffnung der ethnologischen Ära, irgendwo auf der Welt auf eine wirkliche primitive, also „frühere“ Sprache zu stoßen, lösten sich in nichts auf: Alle heute gesprochenen Sprachen sind voll ausgebildet. Ob es eine Ursprache gegeben hat, oder ob die Sprache mehrfach erfunden wurde: auch das blieb unbekannt.

Es liegt nur allzu nahe, die Sprachentstehung mit der Vergrößerung des Hirnvolumens in Verbindung zu bringen. Sie ereignete sich, nach evolutionären Maßstäben fast explosionsartig, bei unseren Ahnen, den Homininen, in der Jahrmillion, die vor etwa 400 000 Jahren, zu Ende ging. Aber da nur etwa 20 Prozent der neu hinzugekommenen Neocortex-Masse mit der Sprachverarbeitung beschäftigt sind, ist diese Verknüpfung leider nicht zwingend: Sprache könnte es auch schon vorher gegeben haben, wie sie später hinzugetreten sein könnte.

Von den bunten Sprachentstehungstheorien sind heute nur noch ganz wenige in der Diskussion. Es sind weniger Theorien als Vermutungen von einiger Plausibilität, die sich gegenseitig nicht ausschließen müssen. Die eine besagt, daß die Sprache der Menschen zunächst eine Gebärdensprache gewesen sei, zu der erst allmählich die Lautsprache hinzutrat, um den Gebärden dann immer mehr Funktionen abzunehmen. Eine andere meint, Sprach- und Werkzeugentwicklung seien Hand in Hand gegangen; sie nährt die Hoffnung, eine Grammatik der Werkzeugherstellung entwerfen zu können, die Rückschlüsse auf die ihr entsprechende. Komplexität der Sprachgrammatik zuläßt. Eine weitere Sprachtheorie ist der Ansicht, die ersten Worte seien gefühlsbetonte Kontaktrufe (Aufforderungen, Feststellungen, Fragen) gewesen. Nach dem Tierkommunikationsforscher P. R. Marler ist die menschliche Sprache nicht aus den einzeln gegeneinander abgesetzten, sondern aus den stufenweise ineinander übergehenden Lautsignalen der höheren Primaten hervorgegangen.

Sicher scheint zu sein, daß von entscheidender Bedeutung für die Fähigkeit zur Lautsprache der aufrechte Gang mit seinen anatomischen Folgen war. Zu ihnen gehörte, daß der Kehlkopf nach unten wanderte und Nasen- und Mundhöhle im Verhältnis zur Rachenhöhle eine stark angewinkelte Stellung annahmen. Dabei ging die Fähigkeit verloren, gleichzeitig zu atmen und zu schlucken; aber es wuchs der Raum, der zur feinen Bearbeitung, zur Modulation der unten an den Stimmlippen hervorgebrachten Laute zur Verfügung stand.

Der amerikanische Lautforscher Philip Lieberman hatte Anfang der siebziger Jahre die Schädel des Schimpansen, des Neanderthalers und des modernen Menschen genauestens verglichen und im Computer simuliert, welche Vokale ihnen möglich gewesen sein können. Er war zu dem Schluß gekommen, daß Schimpansen und auch Neanderthaler die Grenzvokale a, i und u nicht erzeugen konnten, daß ihnen also höchstens eine geringfügige, babygleiche Lautsprache möglich war.

Die Methode war vernünftig, die Ergebnisse waren zweifelhaft. In den letzten Jahren hat der New Yorker Anatom Jeffrey Laitman versucht, auf Grund der Schädelbasis die wahrscheinliche Gestalt verschiedener Stimmtrakte zu rekonstruieren. Er kam zu dem Ergebnis, daß unser mutmaßlicher Vorfahr, der kleine Australopithecus africanus, der vor etwa drei Millionen Jahren in den Savannen Ostafrikas das Überleben bewältigte, über nicht mehr Lautsprachfähigkeiten verfügt haben kann als die heutigen Menschenaffen. Der Neanderthaler, vor etwa 100 000 Jahren, hatte jedoch bereits einen Stimmtrakt wie ein heutiges zwei- bis elfjähriges Kind. Mit dem Cro-Magnon-Menschen vor 40 000 Jahren trat dann die voll ausgebildete Fähigkeit zur Lautsprache in Erscheinung.

Bis zur Erfindung der Schrift verlor sich alle Sprache sofort. Sie hinterließ keine Fossilien. Selbst die Weichteile, die für die Lauthervorbringung entscheidend sind, blieben nicht erhalten. So wird es vielleicht für immer bei phantasievollen, indirekten Vermutungen bleiben müssen; und das Rätsel des Sprachursprungs bleibt ungelöst.

Die sprechenden Affen

Bis Zum Ende der sechziger Jahre war es die allgemeine, felsenfeste Überzeugung, daß kein Tier über irgendeine Sprachfähigkeit verfüge: Zwischen Tier und Mensch klaffte ein unüberbrückbarer Graben. Die größte Umwälzung in der Sprachforschung bestand darin, daß es den Gardners und verschiedenen anderen amerikanischen Psychologen in den letzten zwölf Jahren gelang, berühmt gewordenen Schimpansenmädchen wie Washoe und Lana, dem Gorillamädchen Koko und anderen, Rudimente von Sprache beizubringen – keine Lautsprache, für die die Atmungsorgane der Menschenaffen nicht eingerichtet sind, sondern verschiedene Zeichensprachen. Vielleicht ist die Sprachfähigkeit der Affen begrenzter, als es manchen in der ersten Euphorie schien: Ihre „mittlere Äußerungslänge“ bleibt bald hinter der von Kindern zurück, ihre Syntax gerät jenseits der Zweiwortsätze ins Schwimmen, und im Unterschied zu Menschen machen sie von sich aus, spontan, wenig Gebrauch von der ihnen beigebrachten Sprache. Daß es sich jedoch nicht nur um andressierte Handlungen à la „Kluger Hans“ handelt, sondern tatsächlich um eine simple Sprache, scheint zweifelsfrei festzustehen. Damit ist, in schönem Einklang mit den Erwartungen der Evolutionstheorie, die früher für die Sprache angenommene kategorische Diskontinuität zwischen Mensch und Tier hinfällig.

Die sprechenden Affen lenkten einige Forscher, vor allem den kalifornischen Psychologen David Premack, zu der höchst spannenden Frage, welche Intelligenzleistungen es eigentlich sind, die vorhanden sein müssen, um Sprache hervorzubringen.

Eine anatomische Asymmetrie der beiden Gehirnhälften wurde auch bei Affen nachgewiesen; welche Funktion sie hat, ob sie überhaupt eine Funktion hat, ist allerdings noch unklar.

Auch manche Affen können sprachliche Laute erkennen und unterscheiden.

Eine Grundlage jeder Sprache ist die Fähigkeit zur Begriffsbildung: etwa zur Bildung des Begriffs „Apfel“. Offenbar gibt es vorsprachliche Begriffe: Der Geist kann den Begriff „Apfel“ haben ohne ein Wort dafür. Begriffsbildung setzt die Fähigkeit zur Klassifikation voraus, und diese die Fähigkeit der Abstraktion und Generalisierung: Von allen tatsächlichen gesehenen Äpfeln muß man die zufälligen Eigenschaften, in denen sie sich unterscheiden, abziehen können; und was übrigbleibt, muß man auf eine ganze Klasse von Dingen (eben allen Äpfeln, auch den noch ungesehenen) verallgemeinern können.

Die Begriffsbildung wurde lange für eine Folge der sogenannten mehrmodalen Wahrnehmung gehalten, die es den Menschen möglich macht, jene Daten, die über verschiedene Sinneskanäle (etwa Auge und Ohr) ins Gehirn gelangen, dort so zusammenzufügen, daß die Daten eines Kanals ausreichen, die des anderen in der Vorstellung zu ergänzen: Wer ein Bellen hört, kann sich dazu einen Hund bildlich vorstellen. Die mehrmodale Wahrnehmung jedoch ist entgegen der früheren Annahme kein Alleinbesitz des Menschen, sondern wurde auch bei verschiedenen Affen nachgewiesen.

Keine Sprache ohne ein ausreichendes Gedächtnis. Die gelernten Wörter wären sonst dem Zugriff entzogen. „Die Macht des Wortes hängt von der Informationsmenge ab, die eine Art speichern kann“ (Premack).

Statt von „Vorstellung“ spricht die Psychologie, wo nicht nur bildliche Vorstellungen gemeint sind, gern von „Repräsentation“: der „Vertretung“ der Welt im Geist. Sprache beruht auf einer hohen Repräsentationsfähigkeit. Es müssen vor allem die Beziehungen zwischen wirklichen Ereignissen und ihrer Repräsentation begriffen werden. Die Biene, die ihre Artgenossinnen durch die Bewegungen ihres Tanzes zur Futterquelle dirigiert, begreift ihren Tanz höchstwahrscheinlich nicht als Repräsentation ihres Wissens über die Lage der Blüten, hat also keine eigentliche Sprache.

Eine Sprache muß kreativ sein: Sie besteht nicht aus einem starren Repertoire von Signalen, sondern ist offen, Neues auszudrücken. Die Menschenaffen, die neue Wörter erfanden wie Gesichtshut (für Maske) oder Weinen-wehtun-Frucht (für Radieschen), bewiesen solche Kreativität.

Entscheidend für die Sprache ist jedoch vor allem die Fähigkeit, an die Begriffe für Dinge und für Beziehungen zwischen den Dingen willkürliche Symbole zu heften, zum Beispiel – im Fall der menschlichen Lautsprache – irgendwelche in sich nichtssagende Lautfolgen. Premacks Schimpansin Sarah beispielsweise, die gelernt hatte, daß ein blaues Plastikdreieck „Apfel“ bedeutet, machte Aussagen über Äpfel und nicht über blaue Plastikdreiecke, wenn sie über das Apfelsymbol befragt wurde. Diese symbolisierende oder semiotische Fähigkeit ist also offenbar nicht auf den Menschen beschränkt.

Die große, nach wie vor ungeklärte Frage ist freilich die: Warum hat die Evolution bei den höchsten Primaten so viele Voraussetzungen für Sprache hervorgebracht, eine so enorme „evolutionäre Reserve“ geschaffen, wenn sie diese ihre rudimentäre Sprachfähigkeit von sich aus überhaupt nicht anwenden?

In der Frage, was an der menschlichen Sprachfähigkeit erblich bestimmt ist, rivalisieren drei Positionen miteinander.

  • Die erste ist die des Behaviorismus. Lange Zeit beherrschte sie die Sprachforschung: Nichts ist ererbt, alles wird nach den Gesetzen des Lernens (der Konditionierung, der Verstärkung) erworben. In ihrer einfachen Form darf sie heute als erledigt gelten, aus vielen Gründen, etwa diesen: Das Kind lernt augenscheinlich nicht Einzelfalle von Sprachanwendung; es reproduziert nicht erinnerte Elemente, sondern entnimmt der gehörten Sprache Regeln; es wendet diese Regeln auf neuartige eigene Sätze an, die es nie gehört hat, versieht also im Englischen etwa einen von dem Sprachforscher erst gefundenen wug prompt mit der richtigen Pluralendung -s. Wenn der Spracherwerb sich danach richtete, welche sprachlichen Hervorbringungen von den Erwachsenen korrigiert oder belohnt („verstärkt“) wercen, müßte sich eine höchst bizarre Sprache einstellen. Die monotone Reiz-Reaktions-Psychobgie des Behaviorismus reicht in keiner Weise aus, den schnellen, perfekten Spracherwerb zu erklären.
  • Ihren strengsten Widerspruch erfuhr diese Position durch Noam Chomsky und seinen „Nativismus“. Niemand hat die moderne Linguistik so beeinflußt und inspiriert wie Chomsky – und mit seiner Erkenntnis, daß Kinder sich Regeln aneignen und nicht eine Sammlung von Sätzen, unabsichtlich auch die Kindersprachforschung. Chomskys revolutionäre Leistung von 1957 bestand darin, die Syntax auf ganz neue Weise zu durchschauen und zu beschreiben: hinter der „Oberflächenstruktur“ der Sätze die formal-logischen Operationen zu erkennen, die eine begrenzte Zahl von grammatischen „Tiefenstrukturen“ in die unendliche Vielfalt der möglichen Sätze verwandeln („transformieren“). Die Sprachen erwiesen sich dabei als verwandter denn vorher angenommen: Ihre Tiefenstrukturen sind sich ähnlich, die Zahl der möglichen Transformationen ist begrenzt. Chomskys Transformationsgrammatik hat die Linguistik zu einer der abstraktesten Wissenschaften überhaupt gemacht; sie ist der Natur des-Denkens auf der Spur und nicht mehr irgendeiner Kosmetik des Sprechens und Schreibens. Und obwohl Chomsky sich von seinem Ansatz her eigentlich nur für die Sprache des „idealen Sprecher-Hörers“, für die des gebildeten englischsprechenden Professors interessierte und wenig Beziehung zu Biologie und Genetik hatte, versteifte er sich auf die Meinung, daß die grammatischen Regeln der Sprache von ganz spezifischen linguistischen Genen festgelegt und damit angeboren sein müssen. Die Sprache sei ein Organ, wie das Auge. Nur der Mensch verfüge darüber. Sie sei ohne Zusammenhang zu seiner sonstigen Intelligenz. Allein mit Hilfe genetischen „Wissens“ ließe sich erklären, wieso der Mensch aus dem wenigen, unvollkommenen, ja defekten Sprachmaterial, dem er in der Praxis ausgesetzt ist, seine vollkommene Sprach-,Kompetenz“ ableiten könne.
  • Die dritte Position schließlich ist der „Konstruktivismus“ aus der Schule des Genfer Psychologen Jean Piaget. Für ihn ist nur das Funktionieren der Intelligenz im allgemeinen genetisch festgelegt. Der Spracherwerb ist keine von der sonstigen Intelligenz unabhängige Leistung, sondern nichts als ein „Symptom“ der allgemeinen erkennenden („kognitiven“) Fähigkeit des Menschen, deren allmählichen Aufbau Piaget minuziös beschrieben hat. Die Symbolfähigkeit etwa zeige sich, noch ehe die Sprache auftritt (das Kind behandelt etwa einen Bauklotz als Symbol für ein Haus); sie werde nur unter anderem von der Sprache, die sie als Grundlage benötigt, herangezogen.

Die Kontroverse zwischen Nativismus und Konstruktivismus ist nicht entschieden. Mittelwege sind angedeutet worden. Mir scheint, daß die Position Piagets die fruchtbareren Fragestellungen ermöglicht hat.

Die Wissenschaft geniert sich heute, so allgemeine Fragen wie die nach dem Zusammenhang von Sprache und Denken zu stellen.

Daß es Denken ohne Sprache gibt, soviel scheint klar. Das Kind Helen Keller dachte („empfand Gedanken“), als sie noch ohne Sprache war. Sichtbar denken und folgern die sprachlosen Menschenaffen, denen man eine Banane an die Decke hängt und mehrere ineinandersteckbare Stöcke auf den Boden legt: Sie überlegen, bis sie die Lösung des Problems gefunden haben, wie an die Banane zu kommen ist; und der Erfolg ihres Nachdenkens bringt ihnen ein freudiges Aha-Erlebnis. Klar scheint ebenfalls, daß die Sprache das Denken beeinflußt – erleichtert, präzisiert, potenziert; doch in welchem Maß und in welcher Weise dies geschieht, ist noch längst nicht geklärt.

Die sonderbare Sprache der Hopis

Genauere Untersuchungen löste die sogenannte Whorf-Hypothese aus, auch „Linguistisches Relativitätsprinzip“ genannt. Durch sein Studium der befremdlichen Sprache der Hopi-Indianer war Benjamin Lee Whorf 1956 zu der Überzeugung gelangt: Es gebe kein Denken ohne Sprache, verschiedene Sprachen bewirkten ein verschiedenes Denken, die Sprache zwinge den Menschen ihre Weltanschauung auf. Dem Denken der Hopis etwa fehlten Zeitbegriffe; es kenne keine Dinge und Handlungen, sondern nur Ereignisse. Die Hypothese war dazu angetan, den Menschen Schauer den Rücken entlangzujagen. War jeder unentrinnbar gefangen in seiner Sprache?

In ihrer extremen Form wird die Whorf-Hypothese heute kaum noch vertreten. Erstens stellte sich heraus, daß die Hopi-Sprache weniger fremdartig war als zunächst gedacht. Zweitens zeigte sich, daß die Eigenheiten fremder Sprachen wohl bei wörtlicher Übersetzung oft höchst andersartig wirken, aber von ihren Sprechern einfach als sprachliche Hilfsmittel eingesetzt werden und nicht notwendig auch das Denken tief prägen. Wenn wir uns mit Whorf darüber wundern, daß die Apachen-Indianer „es ist ein regnerischer Frühling“ mit der Wendung „wie Wasser, oder Quellen bewegt sich Weiße nach unten“ ausdrücken, so wunderte sich ein Apache, der sich tiefsinnige Gedanken über das sprachgeprägte Weltbild der Deutschen machte, vielleicht nicht minder über unsere Auffassung von Geschlechtern und Bewegungen, die uns dazu bringt, eine so simple Sache wie „Dampfroß“ als „weiblicher Weg aus Eisen“ auszudrücken; und hinter deutschen Sprachkonventionen wie dem „es“ in „es donnert“ oder „es klopft“ vermutete er vielleicht einen animistischen Kult, der überall waltende Geister vermutet.

Als ideales experimentelles Testfeld erwies sich der Zusammenhang zwischen Farbwahrnehmung und Farbbenennung. Farben nämlich sind objektiv definierbar: Es sind bestimmte Frequenzen des elektromagnetischen Spektrums. Außerdem ist die Farbwahrnehmung höchstwahrscheinlich bei allen Menschen etwa gleich. Wieviel und welche Farben jedoch benannt werden, ist von Sprache zu Sprache verschieden; die Dani auf Neu-Guinea etwa haben nur Wörter für schwarz und weiß. Bei Versuchen stellte sich heraus: Einige Farben des Spektrums (man nannte sie „Fokalfarben“) werden von allen Menschen gleichermaßen als die hervorstechendsten gesehen und am besten erinnert, egal, ob die betreffende Sprache für sie Worte hat oder nicht. Für Fokalfarben werden schneller Wörter gelernt als für andere Farben. Allerdings scheint der Besitz eines Wortes für eine Farbe es dem Gedächtnis leichter zu machen, sie wiederzuerkennen. Aber insgesamt formt offenbar nicht die Sprache die Wahrnehmung, sondern die Wahrnehmung die Sprache: Linguistische und Wahrnehmungskategorien sind kaum trennbar. Ordnung durch Sprache? „Es wäre eine weitaus dankbarere Aufgabe für die künftige Forschung“, schrieb die Psychologin Eleanor Rosch Heider, „zu untersuchen, wie Sprachen, Kulturen und Individuen überhaupt dazu kommen, die Natur auf ihre verschiedenen Weisen zu ‚sezieren‘, zu ‚kategorisieren‘ und zu ‚benennen‘.“

Vier Verse

„Die Sprache ist die Wohnung / von allen, das Haus, hängend / an der Flanke des Abgrunds. / Worte wechseln ist menschlich“ (Octavio Paz) •