Würden Sie gegen Bezahlung ein neues Medikament einnehmen, dessen Wirkung ungeklärt ist? Mit einem Wirkstoff, von dem man nicht genau versteht, ob er wirkt beziehungsweise wie genau diese Wirkung entsteht – und ob es Nebenwirkungen gibt? Ich vermute, die meisten werden an dieser Stelle abwinken. Wer möchte schon als menschliche Laborratte herhalten? Doch was, wenn ich Ihnen sage, dass dies mit großer Wahrscheinlichkeit schon oft in Ihrem Leben geschehen ist, zumindest wenn Sie bei einem Unternehmen in Lohn und Brot stehen?

Freilich hat Ihnen niemand ohne Ihr Wissen Pillen verabreicht. Es geht um jene Maßnahmen und Programme, die in Unternehmen turnusmäßig ausgerollt werden, beispielsweise Vergütungssysteme oder Führungsinstrumente. Gegenwärtig etwa liegt es im Trend, individuelle Boni durch kollektive Zielsysteme zu ersetzen, zuletzt ist die Deutsche Bahn mit entsprechenden Plänen an die Öffentlichkeit gegangen. Für Dirk Sliwka, Professor für Personalwirtschaftslehre an der Universität zu Köln, sind das im Grunde Experimente am Mitarbeiter, wie er mir im Gespräch erläutert. Sliwka gehört zu den 40 führenden Köpfen des Personalwesens in Deutschland und ist ein Proponent des evidenzbasierten Managements. Was hat es damit auf sich?

Die Suche nach kausalen Zusammenhängen

"Manager sollten lernen, ein Stück weit wie Forscher zu denken", sagt Sliwka. "Wenn Maßnahmen unternehmensweit implementiert werden, sollte vorab geklärt sein, dass diese kausal wirksam sind, also tatsächlich das bewirken, was sie zu erreichen versprechen. Man kann natürlich durch Intuition zu richtigen Entscheidungen kommen. Die Erfahrung zeigt allerdings, dass wir uns oft genug irren."

Aber ist es nicht genau das, was Unternehmen tun? Werden nicht ständig Pilotprojekte durchgeführt, um Maßnahmen und Systeme zu testen, bevor sie im ganzen Unternehmen ausgerollt werden? Der Wirtschaftswissenschaftler sagt dazu: "Pilotprojekte und das Sammeln von Daten sind ein guter Anfang. Aber das reicht nicht." Wo liegt das Problem?

Wenn ein Unternehmen beispielsweise ein Training pilotiert, dann ist es zunächst wichtig, vor und nach der Maßnahme systematisch zu erfassen, in welchem Ausmaß die Mitarbeiter der Pilotgruppe das entsprechende Verhalten an den Tag legen. Hat sich bei den meisten Teilnehmern das Verhalten nach dem Training wie gewünscht verändert, dann war die Maßnahme erfolgreich.

Oder doch nicht? "Ohne eine Kontrollgruppe, die im gleichen Zeitraum vermessen wird, lassen sich kaum verlässliche Rückschlüsse ziehen. Wichtig ist zudem, dass dieser Vergleich randomisiert abläuft", sagt Sliwka.

Randomisierung bedeutet, dass die Zuteilung zur Pilot- und Kontrollgruppe zufällig erfolgt. "Man kann hier beispielsweise mit einer Wartegruppe arbeiten", sagt der Forscher. "Ein Teil der Mitarbeiter absolviert das Training sofort, die anderen später. Das ergibt allerdings nur Sinn, wenn die Zuteilung per Zufall erfolgt. Wenn die Teilnehmer sich eigenständig für eine Gruppe entscheiden dürfen, ist damit zu rechnen, dass sich in der ersten Fraktion alle hochmotivierten Menschen sammeln, jene, die das Training begrüßen, während in der zweiten Gruppe vornehmlich jene Menschen landen, die das Ganze als Pflichtübung empfinden." An diesem Punkt wäre die Vergleichbarkeit dahin, weil die vermutete Wirkung des Trainings vom Effekt des unterschiedlichen Engagements überlagert wird. 

In diesem Zusammenhang sind die Begriffe Korrelation und Kausalität relevant. Korrelation bedeutet, dass eine Variable A sich verändert, wenn sich auch eine Variable B verändert, also ein statistischer Zusammenhang besteht. Kausalität hingegen bedeutet, dass sich A verändert, weil sich B verändert, demnach eine Wirkbeziehung besteht. Genau dieser Unterschied ist der heilige Gral des evidenzbasierten Managements. Dafür reicht es allerdings nicht aus, erklären zu können, wie B auf A wirkt. Man muss zusätzlich darlegen, dass es keine besseren Erklärungen für den beobachteten Effekt gibt.