Von Dieter E. Zimmer

Die einfachsten Fragen sind immer die schwersten. Wieviel Wörter hat einer, der Deutsch spricht? Wie viele gibt es denn überhaupt? Adenauer hatte nur achthundert, heißt es. Aber Goethe, der hatte doch bestimmt Hunderttausende... Wir machen uns keine Vorstellung von der Größe des Wortschatzes, des eigenen wie des um uns her. Zehntausend, hunderttausend, eine Million, wer weiß es – aber große Zahlen bedeuten uns sowieso immer nur „viele“.

Jedoch gibt es Situationen, in denen man es gern genauer wüßte. Berufs- und Hobby-Psycholinguisten möchten Genaueres über das Fassungsvermögen des Gedächtnisses wissen; sie möchten auch wissen, welche Leistung Kinder eigentlich erbringen, wenn sie in wenigen Jahren und wie von selbst ihre Muttersprache in sich hineinsaugen.

Wer in einem Alter, in dem man nicht mehr alles hineinfrißt, eine Fremdsprache lernt, der will rationell und zielbewußt vorgehen und sich erst einmal die unentbehrlichsten Vokabeln einverleiben; er wüßte auch gern, wieviel er überhaupt zu lernen hat, um sich einigermaßen behelfen zu können. Die Sprachdidaktik sollte also wissen, welches der Grundbestand einer Sprache ist (und sie weiß es).

Oder all die Software-Firmen, die sich mit Textverarbeitung befassen und von denen wir eines Tages die Alphabetisierung des Computers verlangen müssen: wenn sie sich keine näheren Gedanken machen, ehe sie ein elektronisches Rechtschreib- oder Synonymen- oder Übersetzungswörterbuch in Angriff nehmen, wenn sie nur die Kniffe ihres Programms im Auge haben und die Wörter, mit denen dieses umgehen soll, als eine Art Müll betrachten, den man am besten kiloweise von der Duden-Redaktion bezieht und unbesehen in das Programm einfüllt – dann könnte es ihnen passieren, daß das ganze schlaue Programm der Eigenart der Sprache nicht gewachsen ist und seinen Nutzern wenig nützt. Einige offerieren teures Werkzeug, sich im Eigenbau selber Wörterbücher anzufertigen, „mühelos“ – die langen Gesichter, wenn sich die Mühen dann hinziehen, bekommen sie nie zu sehen.

Wie groß also ist er, der deutsche Wortschatz? Die Sprachwissenschaft schätzt ihn seit langem auf etwa 400 000. Schätzt sie richtig? Seit einigen Jahren gibt es endlich zwei große deutsche Wörterbücher: das sechsbändige „Duden Wörterbuch“ (1976/81) und den ebenfalls sechsbändigen „Brockhaus Wahrig“ (1980/84). Beide sind ausdrücklich auf Vollständigkeit aus. Nur Fachwörter, die nicht in die allgemeine Sprache eingedrungen sind, lassen sie beiseite; ansonsten wollen sie den gesamten allgemeinen Wortschatz verzeichnen. So kommt der „Brockhaus Wahrig“ laut eigener Angabe auf 220 000 Stichwörter, der „Duden“ auf 500 000. Und der Benutzer wiegt beide Werke in den Händen und sagt sich, daß hier etwas nicht stimmen kann. Zwar ist der „Duden“ kleiner gedruckt, aber mehr als der „Brockhaus Wahrig“ enthält er gewiß nicht, eher weniger. Also muß es daran liegen, daß beide Redaktionen unterschiedlich gezählt haben. Tatsächlich heißt es auf dem „Duden“ wörtlich: „Über 500 000 Stichwörter und Definitionen“. Und das will wohl verstanden werden als „eine ungenannte Zahl von Wörtern.in 500 000 Bedeutungen“.

Denn natürlich gibt es viel mehr lexikalische Bedeutungen als Wörter. Einmal liegt es an den zahlreichen Homonymen, also den Fällen, in denen zwei grundverschiedene Wörter zufällig gleich geschrieben werden (Fest und fest, sein und sein). Zum anderen sind sehr viele Wörter polysem, tragen also mehrere Bedeutungen. Wir merken es spätestens beim Übersetzen, wenn etwa ein Hörer mal als listener, mal als Student, mal als receiver wiedergegeben werden will.

Wer überlegt, welches der beiden Großwörterbücher er sich anschaffen sollte, darf sich von ihren inkompatiblen Größenangaben nicht irremachen lassen. Ihr Wortbestand ist nicht Sehr verschieden, der des „Brockhaus Wahrig“ wohl sogar etwa 20 Prozent größer. Man kann ruhig nach dem sonstigen Eindruck gehen: Der „Brockhaus Wahrig“ hat das bessere Papier und Goldschnitt, ist aber auch doppelt so teuer. Der „Duden“ ist etwas weniger umfassend, enthält aber als Belege nicht nur mehr oder minder gekünstelte Beispielsätze, sondern echte Zitate aus der Gegenwartsliteratur. Der „Brockhaus Wahrig“ macht jedes Wort zum Hauptstichwort, der „Duden“ stopft die Ableitungen eines Worts in große „Nester“ (beide Verfahren haben etwas für sich).

Jenseits dieser Wörterbücher gibt es das Vokabular der Fach- und Sondersprachen. Ein Handwerk hat einen Spezialwortschatz von einigen tausend Wörtern. Nach ihren Spezialwörterbüchern zu schließen, hat eine größere Wissenschaft wie die Juristerei oder die Biologie zehn- bis zwanzigtausend, die Riesenwissenschaft Medizin mehr als eine Viertelmillion. Aber die Biologie hat auch für jede Art von Lebewesen mindestens ein Wort, und da es etwa sechs Millionen von Spezies gibt, hat sie zumindest potentiell auch Millionen von Wörtern. Ähnlich ist es um die Chemie bestellt. Ihr eigentliches Vokabular besteht auch nur aus einigen zehntausend Wörtern, aber für jede chemische Verbindung gibt es mindestens ein Wort, und da die Zahl der bekannten organischen Verbindungen schon mindestens fünf Millionen beträgt und jeden Tag um etwa tausend wächst, zählt auch ihr Wortschatz nach Millionen. Das Bundessprachenamt hat im Laufe der Jahre 1,8 Millionen vorwiegend technischer Fachausdrücke gesammelt. Schwer also, auch nur abzuschätzen, in welcher Größenordnung sich der Wortschatz der Fachsprachen bewegt. Ohne die „Eigennamen“ der technischen Gerätschaften und ihrer Teile, der Moleküle, Spezies und Himmelskörper werden es ein paar Hunderttausend sein; mit ihnen sind es weit über zehn Millionen.

Auch der allgemeine Wortschatz läßt sich auf keine Zahl festnageln. Es herrscht ein ständiges Kommen und Gehen: Aus den Fachsprachen und Argots sickern täglich Wörter ein, neue Phänomene wie der Flachbildschirm oder das Restrisiko wollen benannt sein, Medien und Werbebranche überbieten sich im Erfinden neuer Wörter. Bei vielen (Scheidungskind) weiß man gar nicht, ob es sie eigentlich gibt – jedenfalls könnte es sie jederzeit geben. Und manche Ad-hoc-Prägung (Kopfgeldjäger) wird einmal irgendwo benutzt und nie wieder – ex und hopp. Kein Wörterbuch kann da mithalten, kein Sprachstatistiker mitzählen.

Aber auch wenn die Grenze fließend ist: die beiden großen Wörterbücher sind ihr jedenfalls nahe. Wer suchte, fände noch etliche mehr; wer besessen suchte, fände vermutlich noch einige Zehntausend, denn immer gibt es mehr, als man denkt. Hunderttausende von weiteren „allgemeinen“ Wörtern aber gibt es sicher nicht.

Der allgemeine englische Wortschatz wird auf 700 000 Wörter geschätzt. Das größte englische Wörterbuch, der „Webster“, hat 460 000. Warum ist der englische Wortschatz soviel größer als der der anderen Kultursprachen? Meist wird es damit erklärt, daß Englisch eben eine Legierung aus drei Sprachen sei (Angelsächsisch, Normannisch und Latein) und vieles doppelt und dreifach benenne.

Ein Lamm etwa ist das germanische lamb, sein Fleisch das romanische veal. Aber das kann nicht der ganze Grund sein. Deutsch hat die eigentümliche und von Ausländern gern verspottete Möglichkeit, unbegrenzt viele zusammengesetzte Wörter zu bilden, und es macht davon reichlichst Gebrauch. Die Zahl dieser Komposita läßt die der englischen Doppelungen weit hinter sich. Trotzdem ist sein allgemeiner Wortschatz nur halb so groß, rätselhafterweise.

Da steht der allgemeine deutsche Wortschatz im Regal, zusammengetragen von emsigen und stillen Lexikographen. Aber wie viel davon ist unser eigen?

Das Wiedererkennensgedächtnis ist in allem um ein Mehrfaches größer als unser Reproduktionsgedächtnis. Wir verstehen mehr Wörter, als wir jemals gebrauchen.

Wie viele wir verstehen, hat 1977 der Sprachwissenschaftler Gerhard Augst annäherungsweise eruiert. Seine beiden Versuchspersonen verstanden etwa 88 Prozent der 107 000 Wörter des einbändigen „Wahrig“, der damals das größte westdeutsche Wörterbuch der Gegenwartssprache war. Es ist zu vermuten, daß sie von den über doppelt so vielen Wörtern des „Brockhaus Wahrig“ einen nicht viel kleineren Prozentsatz verstünden. Denn wir verstehen ein Wort nicht nur, wenn wir es gelernt haben; es genügt, daß wir seine Morpheme und die Regeln der Wortbildung kennen. Auch wenn wir dem Renditejäger oder dem Turnschuhgreis nie begegnet sind, wissen wir auf Anhieb, was das ist; und wen ein isolierter Schweinepriester vielleicht noch im unklaren läßt, dem hilft der Zusammenhang schnell auf die Sprünge. Also darf man annehmen, daß ein einigermaßen sprachgewandter Deutscher einen passiven allgemeinen Wortschatz von etwa 180 000 Wörtern hat, und dazu das jeweilige Fachvokabular seines Berufs.

Wie viele davon „beherrscht“ einer aber wirklich? Auch das ist schwer zu sagen, denn kein Linguist kann je aufzeichnen und auswerten, was ein repräsentativer Querschnitt seiner Zeitgenossen im Leben alles spricht und schreibt. Mancher aktive Wortschatz mag herzlich klein sein: Morgen – noch ne Tasse – also denn – gib mal – halt den Mund – mach schon – alles klar – was gibts in der Glotze – für mich n Bierchen – Null Ouvert – ein solches Leben läßt sich mit ein paar Hundert Wörtern bestreiten. Das Goethe-Institut und der Volkshochschulverband, die die allermeisten Erfahrungen mit „Deutsch als Fremdsprache“ zu sammeln Gelegenheit hatten, haben als Faustregel: Wer eine Fremdsprache lernt, muß mindestens 8 000 Wörter verstehen und 2 000 selber zu gebrauchen wissen, um sich im Alltag einigermaßen durchschlagen zu können. Je mehr einer spricht und schreibt, und über je mehr Gegenstände er spricht und schreibt, desto größer ist auch die Zahl der Wörter, die er gebraucht. Aber auch die umfangreichsten Schriftsteller-Wortschätze übersteigen selten die 20 000. Man geht also wohl nicht ganz fehl, wenn man den aktiven Wortschatz eines Deutschen – die Zahl der Wörter, die ihm je über die Zunge und in die „Feder“ kommen, auf 2 000 bis 20 000 schätzt. Der eines durchschnittlich Beredten liegt vermutlich in der Nähe der Mitte, bei 10 000.

Das aber ist nur jener Teil des Aktivwortschatzes, der manifest wird. Damit einem im richtigen Augenblick das richtige Wort einfällt, müssen einem wesentlich mehr Wörter zu Gebote stehen. Dieser latente aktive Wortschatz ist mit Sicherheit größer als der manifeste aktive und kleiner als der passive – und liegt im übrigen völlig im Dunkeln.

Der Zufall will es, daß ich dazu eine Art Selbst-

  • Fortsetzung auf Seite 75
  • Fortsetzung von Seite 73

versuch gemacht habe. Ich habe Wörter gesammelt. Ich habe (eine nette Beschäftigung in Migränestunden, wenn man nichts Gescheiteres anfangen kann) eine Wörterliste für einen Spellingchecker zusammengetragen. Ein Spellingchecker ist eine Vorrichtung, die einen bei Computertexten, bei denen man sie leichter übersieht als auf Papier, auf Schreibfehler aufmerksam macht. Die Maschine sucht jedes getippte Wort in einem eigenen Lexikon, und wenn sie es dort nicht findet, läßt sie es blinken oder piepen. Je weniger Wörter das Lexikon enthält, desto öfter blinken auch richtig geschriebene Wörter, und wenn das zu oft geschieht, wird man das Ding lieber abschalten.

Ein Lexikon, das mindestens 98 Prozent der in einer Zeitung wie der ZEIT verwendeten Wörter enthält, muß etwa 50 000 Wörter haben. Als mein Lexikon 40 000 Wörter zählte, begannen immer häufiger solche aufzutauchen, von denen ich wußte: Sie sind mir zwar geläufig, aber benutzt habe ich sie nie. Doch, man kann es oft unterscheiden. Ich kann erkennen, daß ich die Knautschzone oder den Katamaran schon einmal gebraucht habe oder doch jederzeit gebrauchen könnte, den Quereinsteiger oder das Wechselfieber aber nicht. Darum schätze ich nun meinen latenten Aktivwortschatz auf etwa 45 000.

So hätten wir also dies in der Hand. Gesamtwortschatz: mehrere Millionen, nach oben offen. Allgemeiner Wortschatz: 250 000 Wörter in 500 000 lexikalischen Bedeutungen. Individueller Mindestwortschatz: 8 000 passiv, 2 000 aktiv. Ein sechsjähriges Kind, wissen wir aus der Untersuchung von Augst, versteht 27 000 und benutzt 5 200, hat also über Jahre hin Tag für Tag 3 neue Wörter zu gebrauchen und 17 zu verstehen gelernt. Der individuelle Wortschatz eines Erwachsenen beläuft sich auf 180 000 passive und 10 000 aktive Wörter. Und wer 10 000 Wörter verwendet, gebietet tatsächlich über etwa die vierfache Menge.

Die Wörter sind selbstverständlich nicht gleich häufig. Ein Wortschatz ist wie ein Himmelskörper: Er hat einen dichten Kern aus den häufigsten Wörtern, und um den herum schichten sich immer und immer seltenere, bis man in jene Stratosphäre gelangt, wo ein Wort wie Sexpapst oder Muskelmonster kurz aufleuchtet und wieder verglüht, sobald die Illustrierte, auf deren Titelseite es Käufer anmachen soll, makuliert ist.

Bloße drei Wörter machen etwa 10 Prozent eines normalen Textes aus. Wir wissen es, seit F.W. Kaeding, auf der Suche nach der optimalen Stenographie, am Ende des vorigen Jahrhunderts nicht weniger als elf Millionen Wörter durchzählte. (Die Menge entsprach dem Inhalt von zweihundert Büchern, und er hatte noch keinen Computer.) Es sind die Wörter die, der und und Bloße 66 Wörter decken die Hälfte jedes normalen Textes ab. Alle sind sie „Funktionswörter“: Pronomen, Artikel, Konjunktionen, Präpositionen, Hilfsverben – Wörter also, die selber keine lexikalische Bedeutung haben, sondern nur klarstellen, in welchen Beziehungen die „Inhaltswörter“ eines Satzes zueinander stehen. Darum kann man nicht sagen, daß 66 Wörter reichten, um 50 Prozent eines normalen Textes zu „verstehen“. Wer nur die abra ka, dabra gar nichts: Wer nur die Funktionswörter kennte, verstünde gar nichts.

Der Grundwortschatz: 2000

Ein späterer Wortfrequenzforscher, der amerikanische Linguist J. Alan Pfeffer, hat in Hunderten von Interviews mit Nachkriegsdeutschen versucht, so etwas wie den Grundwortschatz zu ermitteln, das absolute Minimum. Er kam darauf, daß 1 300 Wörter 90 Prozent jedes „einfachen Alltagsgesprächs“ abdecken. Aber für jeden weiteren Prozentpunkt braucht es dann schnell mehr und mehr Wörter, und Millionen reichten nicht, jeden Text hundertprozentig zu verstehen.

Die Hoffnung, durch Frequenzuntersuchungen zu einem hieb- und stichfesten Grundwortschatz zu kommen, haben die Linguisten aufgegeben. Von den wenigen hundert der gebräuchlichsten Funktionswörter abgesehen (seltenste Exemplare wie fürbaß mitgezählt, gibt es nicht viel mehr als tausend), hängt es zu sehr von der Art der zugrunde gelegten Texte ab, welche Wörter die häufigsten sind. Anders gesagt: In jeder Lebenssituation sind andere Wörter die häufigsten. Aber wenn man die normalsten Alltagssituationen zusammennimmt, Wohnen, Essen, Verkehr, Gesundheit und so fort, kommt man auf die geradezu magische Zahl 2 000; So groß sind die „Grundwortschätze“, denen heute begegnet, wer auszieht, eine Fremdsprache zu lernen. Darunter geht nichts.

Darunter geht nur Basic English. Es ist nicht einfach irgendein Schrumpf-Englisch. Es ist eine ausgeklügelte Minimalsprache, 1930 ersonnen von dem Cambridger Linguisten C.K. Ogden, wie Volapük oder Esperanto als Welthilfssprache gedacht und von Männern wie Churchill, Roosevelt und Wells lebhaft begrüßt. Anders als die sonstigen Kunstsprachen – und das ist sein Vorzug – beruht es auf einer tatsächlich existierenden Sprache und setzt sich nirgends in Widerspruch zu ihr. Es dampft sie nur radikal ein: auf 850 Wörter, davon 600 Substantive, und dazu 100 Wörter für die allgemeine Wissenschaft und 50 für jedes einzelne Fach. Einigte sich ein internationaler Fachkongreß auf Basic English, wäre er also mit 1 000 Wörtern zu führen. Was ist der Trick? Daß die meisten Begriffe sich in einfacheren Begriffen ausdrücken lassen. Dem Ausländer, der das Wort beeilen nicht versteht, hilft man spontan mit schnell machen aus. Aber um Wörter wie schnell und machen zu definieren, müßte man viele kompliziertere Begriffe aufbieten. Basic English ist eben diese Grundschicht von Begriffen, die sich nicht mehr mit einfacheren Worten definieren lassen. Daß es nicht ohne eine gewisse Würde der Armut ist, demonstriert seine Bibel-Fassung, für die es auch nur 100 zusätzliche Wörter benötigt: At the first God made the heaven and the earth. And the earth was waste and without form; and it was dark on the face of the deep: and the Spirit of God was moving on the face of the waters...

Der Trick indessen kann nur im Englischen funktionieren. Englische Wörter haben eine nahezu unveränderliche Gestalt; deutsche haben viele Flexionsformen, und auch bei der Bildung von Komposita ist das Deutsche viel weniger zurückhaltend. Ein ähnlich knappes Grunddeutsch kann es darum nicht geben.

Und das Maximum? Es ist doch sicher bei jenen zu finden, die von Berufs wegen die Wörter lieben und in ihnen zu Hause sind: bei den Dichtern.

Eine der elementaren Qualitäten jeder besseren Literatur besteht darin, daß sie die Sprache dem Denken ungewöhnlich differenziert und geschmeidig anpaßt. Das eben ist ja die Kunst. Nabokov studierte Wörterbücher, auf der Suche nach seltenen, treffenderen Wort-Exemplaren. In dem – wunderschön ins Deutsche übersetzten – Roman „Drei traurige Tiger“ von Cabrera Infante verspottet der Autor seinen kubanischen Landsmann Carpentier und vor allem dessen Manie, auch noch das letzte Detail bei seinem genauen Namen zu nennen. Doch selbst durch die Parodie hindurch merkt der Leser, daß diese Poesie der Genauigkeit „etwas hat“: „...da wußte er, daß er auf dem richtigen Weg war, daß er sich nicht getäuscht hatte, denn hier waren die erwarteten purpurnen Astragale, die porphyrnen Architrave und die in Chartreuse und Magenta kannelierten Apophygen...“

Der Computer zählt und zählt

Aber auch vom Wortschatz der Dichter macht man sich leicht falsche Vorstellungen. Heute hätte man zumindest Anhaltspunkte. Seit der Computer in die Philologie Einzug hielt, erscheinen nämlich immer wieder Konkordanzen. Das sind – meist sehr unhandliche und unansehnliche – Wälzer, die in alphabetischer Folge sämtliche Wörter eines literarischen Werks samt ihrem Kontext aufführen. Sie dienen dem Literaturwissenschaftler dazu, einzelne Begriffe quer durch ein ganzes Werk zu verfolgen. Zwar ist kaum einer der Umfang eines Wortschatzes zu entnehmen. Die eine schneidet die häufigsten Wörter ab, die andere die, welche nur ein einziges Mal vorkommen (und das sind regelmäßig über die Hälfte). Vor allem bleiben sie die „Lexematisierung“ schuldig. Normale Wörterbücher vereinen alle Formen, in denen ein Wort vorkommen kann, zu einem „Lexem“. Der Computer behandelt alles, was zwischen zwei Lücken steht, als selbständiges Wort. Das Hilfsverb sein ist also unter bin, gewesen, wärest und so weiter zu suchen. Um auf den Umfang eines Wortschatzes zu schließen, muß man deshalb in den Konkordanzen herumrechnen.

Kafkas „Prozeß“ ist aus 6 500 Wörtern gemacht, Melvilles „Moby Dick“ aus 16 000. Storms Wortschatz liegt bei 22 000. Mit ihren 25 000 Wörtern wirkt schon Shakespeares Sprache unglaublich reich. Aber das in Entstehung begriffene „Goethe Wörterbuch“ soll auf etwa 80 000 Lexeme hinauslaufen. Joyces Wortschatz, liest man, habe gar eine Viertelmillion Wörter umfaßt. Es kann nicht sein. Zwar ist der Wortschatz allein seines „Ulysses“ größer als der des ganzen Shakespeare: 32 000. Aber selbst alle die Neuprägungen von „Finnegans Wake“, die ja eigentlich überblendete oder verschriebene normale Wörter sind, übersteigen kaum die 50 000 – so daß sein gesamter Wortschatz sicher unter 100 000 liegt. Aber das mag sehr wohl der größte aktive Wortschatz sein, den je ein Irdischer sein eigen nannte.

Daß Lyriker insgesamt weniger schreiben, macht auch ihren aktiven Wortschatz wesentlich kleiner. Der Wortschatz aller Gedichte Rilkes war nicht viel größer als 5 000. (Seine häufigsten Inhaltswörter waren: Leben, Nacht, weiß, Welt, Gott, leise...) Benns ganze Lyrik bestreiten nicht mehr als 2 700 Wörter. (Seine Favoriten waren Nacht, Meer, Blut, Stunde, Welt...) Hesses Lyrik-Wortschatz ist wesentlich größer: etwa 15 000. Bei näherer Betrachtung sieht man auch warum. Seine Gedichte strotzen von selbstgemachten Wörtern wie Blumenblässe, liebeswund, segenschwer, Sternenspiegel... Genau darum wirken wohl viele von ihnen heute so talmihaft.

Da schwant uns nämlich etwas. Die schiere Menge macht es nicht. Benns geradezu lachhaft kleiner Lyrik-Wortschatz mutet in seiner Spannweite vom Ordinären zum Kostbaren, von Suff und Kleister zu stygisch und Levkoienwelle ganz besonders groß an. Ein kleiner latenter Wortschatz zwar wird auch nur ein dürftiges Werk ergeben. Aber es kommt nicht darauf an, aus den endlosen ungelüfteten Gedächtnisspeichern und seinen Ad-hoc-Wörterfabriken alles, aber auch alles hervorzuholen. Es kommt nur darauf an, es im richtigen Moment hervorholen zu können.