Vorher waren sich alle einig: Die meisten Demoskopen glaubten, einen Sieg für sie aus den Umfragedaten herauslesen zu können. Mindestens zwei, vielleicht sogar sechs Wahlmännerstimmen Vorsprung werde Hillary Clinton bekommen. Mit 71,4 Prozent Sicherheit werde sie gewinnen, behauptete noch am Vorabend das Projekt FiveThirtyEight. Die Betreiber hatten den Wahlkampf wochenlang mit Analysen der Umfrageergebnisse begleitet. "Das ist die schockierendste politische Entwicklung meines Lebens", schrieb Analyst Nate Silver von FiveThirtyEight nach der Wahl.

Wie konnte es dazu kommen?

Fehler stecken in allen Umfragen. Vier Prozentpunkte mehr oder weniger sind durchaus drin und werden mitkalkuliert. Doch Fehler schlagen bei Entscheidungen, bei denen es um ein Entweder-oder geht, besonders stark durch. Bei Brexit oder der US-Wahl geht es um Top oder Flop.

Beispiel Wisconsin. Clinton war dort von FiveThirtyEight ein Sieg prognostiziert worden: 49,6 Prozent für Clinton, 44,3 Prozent für Trump. Tatsächlich hat sich das Verhältnis umgekehrt: Clinton holte 46 Prozent, Trump 48,6. Der Messfehler liegt damit fast innerhalb der vier Prozentpunkte, die völlig normal sind. Doch aufgrund des Wahlsystems der USA fielen nun alle zehn Wahlmännerstimmen dieses Staates an Trump und nicht an Clinton.

Hier waren die Umfrageergebnisse im Detail gar nicht so falsch. Doch letztlich zeigten sie ein völlig falsches Bild. Auch, weil in den meisten Bundesstaaten das Prinzip The Winner takes it all gilt: Bis auf Nebraska und Maine entsenden alle Bundesstaaten ihre Wahlmänner nur für den absoluten Gewinner.

Tatsächlich offenbart sich das Desaster der Demoskopen daher gar nicht im angeblich falsch vorhergesagten Wahlergebnis. Das war von FiveThirtyEight ohnehin schon vorsichtig formuliert worden: Rund 70 Prozent Sicherheit für eine Vorhersage sind eben weit weg von 100 Prozent.

Das eigentliche Problem der Wahlprognosen zeigte sich vielmehr in Staaten wie West Virginia – einem sicheren Staat für Trump, den er erwartungsgemäß auch holte. Nur: Er überholte dabei die Vorhersagen um fast neun Prozentpunkte. Ähnlich war es in North Dakota, Wyoming, Utah, Tennessee und South Dakota. In jedem dieser Bundesstaaten holte Trump mindestens sechs Prozentpunkte mehr, als vorhergesagt worden war. Und Clinton bekam in Washington D.C. fast zehn Prozentpunkte mehr, als die Analysen glaubten. Das sprengt jede Fehlertoleranz und lässt die Demoskopen fassungslos zurück.

Wähler verschweigen, was sie wirklich denken

Unerklärlich aber ist es nicht. Ein Grund ist die Psychologie. Wähler sagen in Umfragen nicht unbedingt ehrlich, was sie wählen werden. Die Mormonen in Utah hatten offiziell ihre Probleme mit Donald Trump, noch größere Probleme aber mit Hillary Clinton. In Umfragen werden diese Menschen aber womöglich eher ausweichend geantwortet haben, anstatt offen zuzugeben, Trump zu wählen. Soziologen nennen das soziale Erwünschtheit. Wenn Menschen wissen, dass ein Verhalten von vielen anderen nicht unbedingt positiv gesehen wird, geben jene, die sich so verhalten, das nicht gern zu.

Staaten, die den Unterschied machten

Quelle: FiveThirtyEight, CNN © ZEIT ONLINE

In psychologischen Fragebogen sind daher immer Fragen enthalten, die schätzen sollen, wie ehrlich die Befragten generell sind. Umgangssprachlich werden diese Fragen auch Lügenskala genannt. Mit harmlosen Fragen wie: "Popeln Sie oft?" wird geschätzt, wie ehrlich diejenigen sind. Denn alle Menschen popeln. Wahlumfragen aber enthalten normalerweise keine Lügenskala. Das kann zu drastischen Vorhersagefehlern führen. FiveThirtyEight ging für den Bundesstaat Utah davon aus, dass Trump 37,3 Prozent der Stimmen bekommen werde. Tatsächlich bekam er dort aber 44,9 Prozent.

Eine weitere Unsicherheit der Statistik ist die Zuspitzung von Informationen im Vorfeld. Medien versuchen, komplexe Beziehungen auf einen klaren und für alle verständlichen Punkt zu bringen. In Überschriften, Tweets und Facebook-Posts wird die Welt auf wenigen hundert Zeichen beschrieben. Fehlermargen, Unschärfen oder Unsicherheiten fehlen in den Mosaiksteinchen und damit auch im ganzen Bild. Aus "70 Prozent Sicherheit für eine Prognose" werden da leicht "70 Prozent für Clinton". Beide Aussagen haben aber nichts miteinander zu tun. Die erste bezieht sich nur darauf, wie gut die Vorhersage generell ist, die zweite macht daraus fälschlich einen Sieg für Clinton.

Dass das auch Auswirkungen auf das tatsächliche Wahlverhalten hat, liegt auf der Hand. Warum noch wählen, wenn das Ergebnis schon feststeht? Warum wählen, wenn das eigene Protestkreuzchen vielleicht gar keine Auswirkung auf das Ergebnis haben wird? Die Vereinfachung von statistischen Zusammenhängen kann so eine Sicherheit und Klarheit erzeugen, die es gar nicht gibt.

Zu wenige Daten

Dazu kommt ein Problem, das auf den ersten Blick gar nicht zu erkennen ist: Es gibt zu wenige Daten, auch wenn es so aussieht, als seien es unglaublich viele. Denn Wahlen sind zu seltene Ereignisse, um sie sicher analysieren zu können.

In diese Falle scheint das Wahlkampfteam der Demokratischen Partei getappt zu sein. Ihm stehen so detaillierte Daten über die potenzielle Wählerschaft zur Verfügung, dass einem deutschen Datenschützer die Haare zu Berge stehen würden. Diese Datentöpfe suggerierten dem Clinton-Team offenbar, dass man wegen der vermeintlichen Führung der Kandidatin das Engagement in Wisconsin, Minnesota and Michigan zurückfahren könne. Das hat sich gerächt.

In Fällen wie dem Brexit oder der US-Wahl gebe es nicht genug Daten, schreibt der Kolumnist und Analyst Barry Ritholtz: "Man kann Emotionen nicht modellieren. Modellierung funktioniert gut, wenn man eine lange Serie wiederholbarer Ereignisse hat, so was wie Transaktionen mit der Kreditkarte." Ein Brexit hingegen sei eine einmalige Sache. Es gebe keine Daten eines früheren Brexit. Das Gleiche gilt seiner Meinung nach für Präsidentschaftswahlen. Sie finden nur alle vier Jahre statt. "Die Daten sind einfach nicht alt genug", schreibt er.

In den vier Jahren dazwischen haben sich die Einstellungen der Wähler so gewandelt, dass die Wahlen nur bedingt miteinander vergleichbar sind, auch wenn die Wahlprognosen etwas anderes suggerieren. Was wie Big Data aussieht, ist eigentlich Small Data. Und der Wissenschaftler und Big-Data-Experte Viktor Mayer-Schönberger sagt: Small Data ist tot.