Es wäre kühn zu behaupten und wohl kaum zu beweisen, daß Berliner Abiturienten dümmer sind als bayerische. Dennoch lag ihr Notendurchschnitt von 1972 bis 1974 um 0,5 Einheiten unter dem Durchschnittswert der bayerischen Abiturienten. Die so heftig umstrittene Bönüs-Malus-Regelung, die diese Unterschiede auszugleichen sucht, hat eine Tatsache drastisch insöffentliche Bewußtsein gerückt, die auf Grund von Ergebnissen aus vier wissenschaftlichen Untersuchungen Fachleuten bereits vorher bekannt war: Schulnoten sind von Bundesland zu Bundesland nicht vergleichbar.

Doch auch zwischen einzelnen Gymnasien bestehen beträchtliche Unterschiede, wenn zensiert wird. Ich habe die Notendurchschnitte der besten zehn Prozent Oberprimaner aus nahezu allen Gymnasien in fünf Bundesländern über mehrere Jahre hin beobachtet. Das Ergebnis: Einige Schulen hatten durchweg ein höheres, also besseres Notenniveau als andere, und ihre Abiturienten kamen auf eine mittlere Gesamtnote von 1,5; die Abiturienten der Schulen mit dem generell niedrigeren Notenniveau dagegen erreichten nur einen Mittelwert von 2,7. Derartige Befunde werden gerne mit dem Argument abgetan, solche Differenzen spiegelten eben die Unterschiede im tatsächlichen Leistungsstand der Schüler dieser Gymnasien. Weit gefehlt! Eine jüngere Studie aus Marburg nimmt diesem Einwand den Wind aus den Segeln: Nicht das Leistungsniveau der Schüler, so weist sie nach, sondern das Benotungsniveau der einzelnen Schulen ist für die Diskrepanzen verantwortlich. Der Schluß ist zwingend: Schulnoten sind von Schule zu Schule nicht vergleichbar.

Was passiert, wenn verschiedene Lehrer dieselbe Leistung eines Schülers zensieren? Zu dieser Frage liegen rund zwei Dutzend experimentelle Untersuchungen vor. In einer österreichischen und auch in einer deutschen Studie haben mehrere Lehrer denselben Schüleraufsatz bewertet. In beiden Fällen streuten die Zensuren über die gesamte Notenskala – dasselbe Stück Sprache wurde also mit sehr gut bis ungenügend benotet, gerade als wäre das Zensieren eine Lotterie. Sogar Mathematikarbeiten, die doch eindeutig als richtig oder falsch zu qualifizieren sind, wurden ähnlich unterschiedlich von verschiedenen Lehrern zensiert. Die Ergebnisse beweisen: Schulnoten sind von Lehrer zu Lehrer nicht vergleichbar; es hängt weitgehend vom Zufall der Klassenzugehörigkeit ab, ob eine bestimmte Leistung schlecht oder gut benotet wird.

Die exakten Zahlen für Zensuren – eins, drei oder sechs – erwecken den Eindruck, als ginge es bei den Noten absolut präzise zu. Das ist gar nicht der Fall. Der gleiche Zahlenabstand zwischen benachbarten Noten entspricht nämlich keineswegs gleichen Unterschieden in der schulischen Leistung. Man kann also nicht sagen, der Schüler A mit der Note eins sei um genau so viel besser als der Schüler B mit einer zwei, wie dieser besser ist als der Schüler C, der eine drei hat. Aus der Notenskala läßt sich ganz allgemein nur ablesen, daß gut besser ist als befriedigend und sehr gut besser als gut – nicht aber um wieviel genau die eine Note besser ist als die andere. Diese Überlegung erscheint vielleicht zu abstrakt; sie hat aber eine ganz handfeste Konsequenz: Durchschnittswerte dürfen nur aus Daten gebildet werden, die stets genau denselben Bedeutungsabstand haben; bei Schulnoten sind die Bedeutungsabstände aber nicht bekannt. Meßtheoretisch ist also auch und allein schon aus diesem Grund die Bildung von Mittelwerten aus mehreren Einzelnoten unzulässig, das heißt: Die Noten auf der Zensurenskala täuschen eine Präzision vor, die die einzelnen Bewertungsstufen gar nicht haben.

Das Ergebnis all dieser Befunde – und damit die Antwort auf meine erste Frage – ist demnach eindeutig: Ein Bewertungsinstrument, das zu verschiedenen Zeitpunkten, von Fach zu Fach, von Schulzweig zu Schulzweig, von Bundesland zu Bundesland, von Schule zu Schule und von Lehrer zu Lehrer nach unterschiedlichen Maßstäben gehandhabt wird und das allenfalls eine Rangordnung, nicht aber eine genaue Qualifizierung von Leistung erlaubt, mißt einfach nicht genau. Schulnoten besitzen also keineswegs die Aussagekraft, die von ihnen bei der Zulassung zum Studium verlangt wird.

Damit beantwortet sich die zweite Frage nach der Beziehung zwischen Schulnoten und Studienerfolg scheinbar von selbst: Auf ein so ungenaues Instrument kann sich keinerlei verläßliche Vorhersage gründen, möchte man meinen; doch diese Antwort wäre zu undifferenziert. Es gibt nämlich mittlerweile etwa dreißig deutsche und fast tausend amerikanische Einzelstudien, die sich mit der Beziehung zwischen Schulleistung und Studienerfolg befassen. Sie alle kommen zu demselben Resultat: die Vorhersagetauglichkeit aller anderen bekannten Prognoseverfahren ist geringer als die des Schul-Abschlußzeugnisses. Schulnoten sagen mithin den Studienerfolg besser voraus als alle anderen Prognosefaktoren. Obgleich andere Prüfverfahren wie etwa Tests wesentlich objektiver sind, weist keines von ihnen einen höheren Zusammenhang mit der Examensleistung auf als dieses. Das ist eine erstaunliche Tatsache, die man sich nur mit drei Überlegungen erklären kann:

Erstens: Schulnoten gründen auf einem sehr langen Beobachtungszeitraum. Anders als in allen übrigen Meßprozessen schlagen sich in ihnen Merkmale des Schülerverhaltens nieder, die nur über viele Jahre hin beobachtbar sind – beständige Lern- und Leistungsbereitschaft, die Fähigkeit am Ball zu bleiben, Durchhaltevermögen oder Langzeit-Motivation, wie es im Psychologen-Rotwelsch heißt.