Ein Tourist beobachtet nachts in einer fremden Stadt, wie ein Taxifahrer ein parkendes Auto beschädigt. Er glaubt, ein blaues Taxi erkannt zu haben. Da es in der Stadt nur zwei Taxiunternehmen gibt, eines mit blauen und eines mit grünen Autos, fällt der Verdacht sofort auf den Unternehmer mit den blauen Taxis. Um sicher zu gehen, führt die Polizei am nächsten Abend unter ähnlichen Bedingungen einen Test mit dem Zeugen durch. Das Ergebnis: Mit jeweils 80-prozentiger Sicherheit identifiziert er grüne und blaue Wagen. Diese 80 Prozent sind für den Richter ein hinreichender Beweis, er verurteilt den Taxiunternehmer.

Ist das korrekte Statistik? Mitnichten. Wenn man nämlich berücksichtigt, dass es in der Stadt 25 grüne, aber nur 5 blaue Taxen gibt, dann ergibt sich eine ganz andere Rechnung: Von den grünen Taxen erkennt der Zeuge fälschlich 5 als blau, von den blauen richtigerweise 4. Wenn man ihm also in der Dunkelheit ein zufällig ausgewähltes Taxi präsentiert und er sagt "blau", dann ist es mit größerer Wahrscheinlichkeit, nämlich in 5 von 9 Fällen, in Wahrheit ein grünes gewesen!

Alles klar? Es lohnt sich, diese Kopfnuss in Ruhe zu knacken - sie ist vielleicht das wichtigste von vielen Beispielen, mit denen Hans-Peter Beck-Bornholdt und Hans-Hermann Dubben in ihrem neuen Buch Der Schein der Weisen die Probleme der Statistik illustrieren, und sie hat radikale Konsequenzen. Denn so, wie der Richter in dem Taxi-Beispiel Statistik betreibt, so wird es auch in der wissenschaftlichen Praxis oft gemacht - mit gravierenden Folgen.

Wenn eine neue medizinische Therapie mit einer alten verglichen wird, dann ist für die Statistiker der wichtigste Wert der so genannte "p-Wert". Der beschreibt die Wahrscheinlichkeit, dass ein positives Ergebnis für die neue Therapie nur durch Zufall zustande gekommen ist. Ein wenig irreführend nennt man das die "Irrtumswahrscheinlichkeit", die Größe ist vergleichbar mit der 80-prozentigen Sicherheit, mit der unser Zeuge die Farbe eines Taxis erkennt. Aber der p-Wert sagt tatsächlich nichts darüber aus, mit welcher Wahrscheinlichkeit die neue Therapie wirklich besser ist. Dazu müsste man nämlich, analog zum Taxi-Beispiel, wissen, wie groß die Wahrscheinlichkeit ist, dass die Therapie überhaupt eine gute Therapie ist. Und das weiß natürlich niemand.

Um das Problem anhand eines Beispiels zu illustrieren: Man probiert zur Heilung einer gefährlichen Krankheit willkürlich zwanzig verschiedene chemische Substanzen aus, deren "Wirkung" man mit einem Placebo vergleicht. Wenn der p-Wert dieser Untersuchung 0,05 ist, dann heißt das nur, dass im statistischen Mittel einer dieser Tests fälschlicherweise ein positives Ergebnis bringt. Über die Frage, die Mediziner wirklich interessiert, nämlich die Wahrscheinlichkeit, dass eine dieser "Arzneien" tatsächlich gegen die Krankheit wirkt, sagt der Wert überhaupt nichts aus - die dürfte eher bei null liegen.

Auf dieses Problem bei der Berechnung "bedingter Wahrscheinlichkeiten" hat schon vor mehr als 300 Jahren der Reverend Thomas Bayes hingewiesen. Beck-Bornholdt und Dubben beschreiben nun in aller Schärfe, wie dieser theoretische Streit der Statistik sich auf die medizinische Forschung auswirkt. Ihr Fazit: Medizinstatistik ist nicht nur in der Praxis mangelhaft, wie sie im ZEIT-Interview beklagen, sondern steht auch theoretisch auf wackeligen Füßen. Ihr radikales Plädoyer: Wir brauchen eine "statistikfreie Forschung". Erste Vorschläge für eine neue Methodik machen sie in ihrem Buch.

Hans-Peter Beck-Bornholdt, Hans-Hermann Dubben:
Der Schein der Weisen. Irrtümer und Fehlurteile im täglichen Denken
Hoffman und Campe, Hamburg 2001; 207 S., 18,39 EURO