Von Günter Trost

Jedes Jahr sind es einige zehntausend mehr: Zwanzigjährige, die das Gymnasium mit guten und sehr guten Noten verlassen und die doch wenig später erfahren, daß ihnen ihr Studienfach und die Hochschule ihrer Wahl für Jahre verschlossen bleiben. Plötzlich haben Banalitäten schicksalhafte Bedeutung – etwa die Frage, ob ein Bewerber um einen Studienplatz in Medizin in irgendeinem Nebenfach wie Geschichte oder Erdkunde irgendwann einmal eine Eins oder nur eine Zwei erhielt. Ein solcher Unterschied entscheidet bei der Durchschnittsnote im Abiturzeugnis über die erste Stelle hinter dem Komma und damit auch über Studien- und Berufschancen eines Menschen.

Die beklemmende Bedeutung, die minimale Differenzen auf der Notenskala von eins bis sechs haben, fordert zwei Fragen heraus. Erstens: Sind Schulzensuren – genauer: der Bewertungsprozeß, der sich in ihnen ausdrückt – wirklich vergleichbar und so genau zu messen, daß sie die überaus wichtige Entscheidung rechtfertigen, ob ein Studienplatz vergeben oder verweigert wird? Zweitens: Erlauben Schulnoten überhaupt Schlüsse auf die Eignung fürs Studium? Die erste Frage zielt also auf die Präzision des Meßinstruments Schulzensur, die zweite auf den Prognosewert der Schulnote im Hinblick auf die Studienleistung. Zum Glück gibt es im In- und vor allem imAusland eine ganze Menge empirischer Untersuchungen, die Teilaspekte dieser Fragen beantworten. Trägt man die Mosaiksteinchen dieser wissenschaftlichen Einzelbefunde zusammen, so zeichnet sich insgesamt ein überraschend einheitliches Bild ab.

Die Noten derselben Schüler in denselben Fächern verändern sich über die Jahre hin beträchtlich, wie der Saarbrücker Psychologie-Professor Orlik bei einem Vergleich der einzelnen Zensuren im Zeugnis der mittleren Reife mit den Noten im Abiturzeugnis nachwies: sie stimmten nur etwa in der Hälfte aller Fälle überein. Viele Schüler, deren Leistung in Mathematik zum Beispiel am Ende der 10. Klasse noch mit einer Zwei honoriert worden war, hatten am Ende der Oberschule eine Vier – oder umgekehrt. Es ist wirklich nicht anzunehmen, daß die Fähigkeiten, die für den schulischen Erfolg bestimmend sind, in einer so kurzen Zeit in einem solchen Ausmaß schwanken, wie dies die schwankenden Zensuren glauben machen. Dafür ist vielmehr ein ganz anderer Grund verantwortlich: die Tatsache nämlich, daß die verschiedenen Lehrer, die dieselben Schüler im Lauf der Schulzeit unterrichten, nur äußerst selten beim Notengeben übereinstimmen.

Selbst ein und derselbe Lehrer beurteilt dieselbe Arbeit zu verschiedenen Zeitpunkten ganz unterschiedlich. Das ist das Ergebnis einer sorgfältigen amerikanischen Untersuchung, die bereits 1930 gemacht wurde. Dieselben Geschichts- und Geographiearbeiten wurden durch dieselben Prüfer im Abstand von nur elf Wochen zweimal und dabei derart unterschiedlich bewertet, daß man zweifeln möchte, ob die Prüfer beide Male wirklich dieselben waren. Bei einigen stimmte nur etwa jede vierte Note der Erst- mit der Zweit-Korrektur überein. Von einem zuverlässigen Meßinstrument ist zu fordern, daß es zu ganz verschiedenen Zeiten die gleichen Ergebnisse liefert. Schulnoten genügen diesem Anspruch nicht; sie sind zeitlich instabil.

Weil wir alle mal zur Schule gegangen sind, wissen wir, daß eine Zwei in Religion leichter zu erreichen ist als in Mathematik. Das ist eine Erfahrung, die durch viele deutsche Untersuchungen statistisch gesichert ist. In den musischen Fächern und in Religion wird am mildesten, in den Hauptfächern am schärfsten zensiert. Daraus ist zu folgern: Schulnoten in verschiedenen Fächern sind nicht vergleichbar. Deshalb ist es auch aus meßtheoretischer Sicht barer Unsinn, aus den Zensuren in den verschiedenen Fächern einen einfachen Mittelwert als Gesamtnote zu errechnen. Das folgende Beispiel zeigt es: Die Durchschnitts – note zwei müßte, wenn sie aus drei Einsen in Biologie, Gemeinschaftskunde und Musik und aus drei Dreien in Mathematik, Deutsch und Englisch zustande kommt, wesentlich weniger wert sein, da sie weitaus leichter zu erlangen ist als die gleiche Zwei, die sich aus Einsen in Mathematik, Deutsch und Englisch und aus Dreien in Biologie, Gemeinschaftskunde und Musik ergibt.

Zwei deutsche Studien, für die jeweils die Schulzeugnisse von mehreren tausend Gymnasiasten analysiert würden, weisen nach, daß in den verschiedenen Zweigen der Gymnasien – altsprachlich, neusprachlich, mathematisch-naturwissenschaftlich – Zensuren nach stark divergierenden Maßstäben gegeben werden. Besonders beweiskräftig ist eine der Untersuchungen, weil sie auch die Intelligenz der Schüler mit berücksichtigt. Diese Arbeit zeigt, daß Leistungen in denselben Schulfächern in verschiedenen Gymnasialzweigen auch dann unterschiedlich bewertet werden, wenn die Schüler der einzelnen Schulzweige in ihrer Intelligenz nicht voneinander abweichen. Daraus folgt: Schulnoten in verschiedenen Schulzweigen sind nicht vergleichbar.