Das Bewerten von Hausarbeiten und Klausuren ist eines der größten Ärgernisse im Bildungswesen. Für Schüler und Studenten, da sie oft wochen- oder monatelang auf Ergebnisse warten müssen. Und für Lehrer, Dozenten und Professoren, da sie viel Zeit investieren, die Ihnen fehlt, um zu unterrichten und zu forschen.

Ein neues Computerprogramm könnte Abhilfe schaffen. Wie die New York Times berichtet, hat das Unternehmen edX eine Software entwickelt, die schriftliche Arbeiten automatisch benotet. EdX ist ein Gemeinschaftsprojekt der Harvard University und des Massachusetts Institute of Technology (MIT).

Zunächst müssen Prüfer der Software vermitteln, wie sie selbst Texte benoten. Dazu füttert man das System mit mindestens 100 Arbeiten und den Noten, mit denen sie bewertet worden sind. So lernt die Software, wie sie künftige Texte bearbeiten soll. "Lernfähige künstliche Intelligenz" nennen Informatiker diese Technik.

Für Prüfungen mit weniger als 100 Teilnehmern taugt das System nicht. Zehn oder 20 Klausuren reichen nicht aus, um den Bewertungsstil des Prüfers zu lernen. Für große, landesweite Vergleichstests oder Aufnahmeprüfungen von Universitäten könnte sich das Programm aber durchaus als nützlich erweisen.

Ursprünglich hatte edX seine Software für die derzeit gefragten Onlinekurse namens Massive Open Online Courses (MOOCs) entwickelt. Neben Coursera und Udacity gehört edX zu den größten Anbietern dieser Kurse. An den kostenlosen Abschlussprüfungen nehmen viele Tausend Menschen teil. Sie von Hand zu benoten, ist ein enormer Aufwand, weshalb die Unternehmen bislang nur Multiple-Choice-Tests anbieten. Die neue Bewertungssoftware könnte dagegen auch Prüfungen in Form von Hausarbeiten und Essays ermöglichen.

Es gibt bereits mehrere Anbieter von Textbewertungs-Programmen. Einige amerikanische Schulen setzen derartige Verfahren schon ein. Mit den MOOCs steigt der Bedarf. Die Verantwortlichen von edX wollen ihre Software aber auch Schulen und Universitäten anbieten. Die Qualität der Beurteilungen sei mit der von menschlichen Korrektoren vergleichbar.

Ein Ersatz für Prüfer ist die Software noch nicht

Das bestätigt eine Studie der Universität Akron in Ohio. Dort ließ ein Forscherteam im vergangenen Jahr rund 22.000 Arbeiten von verschiedenen Programmen bewerten. Anschließend verglichen die Wissenschaftler die automatische Beurteilung mit der Benotung durch echte Prüfer. In der Tat stellten sie fest, dass die Bewertungen kaum voneinander abwichen. Allerdings verwendet die Studie relativ kurze Textstücke aus dem Schulbereich. Außerdem ist sie methodisch umstritten, weil die Daten keinen statistischen Tests unterzogen worden waren.

Für MOOCs mag die Bewertung von Texten mittels künstlicher Intelligenz eine Bereicherung sein. Dass die Software menschliche Prüfer in allen Bereichen ersetzen kann, ist dagegen kaum vorstellbar. Ein Computer, der alle sprachlichen und inhaltlichen Nuancen eines komplexen Textes erkennt, bleibt Science-Fiction. Zumindest in Deutschland würde es wohl auch am Verwaltungsgericht scheitern, wenn Menschen aufgrund der Entscheidung eines Algorithmus etwa der Studienplatz verweigert wird.