Reproduzierbarkeit von Studien : Ein einmaliges Ergebnis

Wie solide sind die Resultate von sozialpsychologischen Studien? Unter Forschern ist ein heftiger Streit entbrannt.

Der "Florida-Effekt" gilt als Klassiker der psychologischen Literatur. Er geht auf ein schlagendes Experiment des US-amerikanischen Sozialpsychologen John Bargh aus dem Jahr 1996 zurück. Dieser ließ seine Versuchspersonen zunächst Sätze aus lauter Wörtern bilden, die mit dem Alter assoziiert werden – "grau", "Falte", "vergesslich", "Glatze", "Florida". Danach mussten die Probanden durch einen Korridor in einen anderen Raum gehen (wobei Bargh heimlich ihr Gehtempo maß). Ergebnis: Sie liefen in der Regel deutlich langsamer als andere Studienteilnehmer, die mit "neutralen" Wörtern jongliert hatten.

Seither wird Barghs Studie als Paradebeispiel für den Effekt des "Priming" zitiert: Durch subtile Beeinflussungen (wie etwa stimmungserzeugende Wörter) kann man implizite Gedächtnisinhalte aktivieren, die das Verhalten beeinflussen.

Die Frage ist nur: Stimmt Barghs Ergebnis überhaupt? Seit einiger Zeit plagen die Psychologen Zweifel. Gesät hat sie Stéphane Doyen von der Freien Universität Brüssel, der Barghs Studie wiederholte – und keinen "Florida-Effekt" fand. Als Doyen dieses Nichtergebnis vergangenes Jahr in einer Fachzeitschrift beschrieb, reagierte Bargh mit einem wütenden Blogbeitrag, und viele Sozialpsychologen horchten auf.

Seitdem quält die Branche die tiefgründige Frage: Wie solide sind die Forschungsergebnisse in ihrem Fach überhaupt? Was sind Studien wert, wenn sie nicht wiederholbar sind? Replikationsversuche sind schließlich die wissenschaftliche Feuerprobe. Wenn sie nicht gelingen, ist das zwar noch keine Widerlegung. Aber ein Fragezeichen.

Nun hat die schwelende Debatte neuen Zunder bekommen: Im Fachmagazin Plos One beschreibt der Londoner Psychologe David Shanks, wie er – vergeblich – einen anderen Priming-Effekt zu wiederholen versuchte. Im Originalexperiment hatte Ap Dijksterhuis an der Universität Nijmegen 1998 einen Teil seiner Probanden gebeten, sich einen typischen Professor vorzustellen, und ihnen danach Wissensfragen gestellt (Wer malte Guernica? Wie heißt die Hauptstadt von Bangladesch?) Dabei schnitten jene, die zuvor an einen Professor gedacht hatten, besser ab. Nun, 15 Jahre später, zeigte sich in Shanks’ Wiederholungsstudie nichts dergleichen.

Das ist Wasser auf die Mühlen des Nobelpreisträgers Daniel Kahneman. Der Psychologe hatte schon im vergangenen Herbst in einem offenen Brief an seine Kollegen gewarnt: Die Priming-Forschung sei zum "Paradebeispiel für Zweifel an der Integrität psychologischer Forschung geworden", er sehe "eine Katastrophe heraufziehen". Als Gegenmittel schlug er den Forschern eine Art Replikations-Karussell vor: Mehrere Top-Institute sollten je eine Studie auswählen, die dann eines der anderen zu replizieren versuchen solle. Gelinge dies, sei das Forschungsfeld rehabilitiert.

Die Debatte um das Ergebnis von David Shanks zeigt, wie rau der Ton mittlerweile geworden ist. "Shanks hat grundlegende Fehler gemacht", erregt sich Ap Dijksterhuis, der Autor der ursprünglichen Professoren-Studie. "Dijksterhuis ist nicht sehr entgegenkommend", hält Shanks dagegen, "er gibt die Protokolle zum Originalversuch nicht heraus." Dijksterhuis betont, dass sein Ergebnis vor Shanks von mehreren Forschern bestätigt worden sei; Shanks sagt, genau darüber gebe es Uneinigkeit. Das Fachmagazin Nature wiederum veröffentlichte jüngst einen Artikel, der eher Shanks’ Sichtweise widerspiegelte, rudert jetzt aber auf Intervention von Dijksterhuis hin zurück.

Anzeige

Stellenangebote in Wissenschaft & Lehre

Entdecken Sie Jobs mit Perspektive im ZEIT Stellenmarkt.

Job finden

Kommentare

35 Kommentare Seite 1 von 5 Kommentieren

Der Postbote war es

Vielleicht wurde die Studie von einem Postboten wiederholt. Bei uns hat auch schon zwei Jahre lang ein Postbote eine psychiatrische Abteilung geleitet (er flog wegen einer Krankenschwester auf die ihn von früher kannte). Inklusive Vorträgen vor Kollegen also anderen Ärzten aus dem Bereich Psychiatrie. Einfach mal googlen gibt auch ein Video wo er über die Zeit erzählt. Wirft ein ziemlich schlechtes Licht auf die Zunft...

@ 17: Zählbares zählen, nicht Nichtzählbares

Zitat: "Die menschliche Komponente ist genau eine davon. Nicht mehr, nicht weniger!"
Mag sein, daß Reaktionsfähigkeit, Vorkenntnisse, Geschick, Aufmerksamkeit, Sorgfalt, Klugheit und Co. insgesamt nur eine einzelne Komponente sind (so wie dann vermutlich alle Arbeitsmittel ja auch nur eine sind, Protokolle auch nur eine sind usw.), aber eine qualitative 1:1-Beziehung ist noch keine quantitative 1:1-Beziehung.

Zitat: "Eigentlich müsste es selbstverständlich sein, dass ein solches Experiment mindestens 3, 4 Mal mit gleichem Ergebnis reproduziert wird, bevor dieses überhaupt als valides Ergebnis anerkannt wird."
Man kann auch Fehler drei- und viermal wiederholen. Reine Wiederholung (gar unter den gleichen Rahmenbedingungen) macht nichts besser. Aber das tatsächliche "Bessermachen" würde mancherlei erfordern, was der Gegenwart gegen den Strich geht: offene Kommunikation auch von eigener Skepsis und aufgefallenen Problemen, Zusammenarbeit über das eigene Team hinaus, Zurückstellen eigener Interessen hinter solide, gute Arbeit...

MGv Oyamat