Jetzt ist das anders: Die größten Durchbrüche bei Big Data verspricht man sich gerade dort, wo so unterschiedliche Datenquellen wie Twitter-Nachrichten, Wetterdaten, Verspätungsmeldungen eines städtischen Nahverkehrssystems oder Verkaufsdaten eines Supermarktes mit Computerhilfe kombiniert werden – um daraus Prognosen, Dienstleistungen oder gar neue Produktideen zu destillieren.

Geplant ist eine Kreuzung aus Informationstechnik und Mathematik, die die Datenmassen erst beherrschbar macht und sie dann in einen neuen Rohstoff für die Wirtschaft verwandelt. »Viele Firmen haben im Augenblick zwar große Datenmengen, kommen aber nicht an die Inhalte ran«, schildert Wolf Lichtenstein, Geschäftsführer der SAS Institute GmbH in Heidelberg, das Problem – und verspricht, dies für seine Kunden zu ändern.

Hal Varian, ein viel zitierter kalifornischer Ökonom und Google-Berater, hat vor einigen Jahren einmal vorausgesagt: »Der attraktivste Job in den kommenden zehn Jahren wird der des Statistikers sein.«

Reine Zukunftsmusik ist das längst nicht mehr. Seit ein paar Jahren entsteht eine wachsende Industrie rund um Big Data. Zahlreiche große Konzerne berichten heute von irgendwelchen Big-Data-Projekten; in Deutschland sind es beispielsweise die Allianz-Versicherung, die Drogeriemarktkette dm und der Autohersteller BMW. Nach wie vor gilt Big Data als eine riskante Investition – »44 Prozent aller Big-Data-Projekte werden gar nicht erst vollständig zu Ende geführt«, meldet die Beratungsfirma Infochimps aus Austin in Texas –, aber es gibt eben zunehmend Erfolgsgeschichten.

Funkende Flugzeugmotoren

Da ist zum Beispiel die Firma Vestas Wind Systems aus Århus. Der dänische Weltmarktführer für den Bau von Windkraftanlagen kann heute innerhalb weniger Stunden für praktisch jeden neuen Standort ausrechnen, wie viel Wind dort unter optimalen Bedingungen in den folgenden Jahrzehnten geerntet werden kann – also kann Vestas den Standort für eine neue Anlage optimieren, ein schlagendes Verkaufsargument.

Damit die Vorhersagen auch stimmen, führt Vestas historische Datenbanken über Temperatur, Feuchtigkeit, Niederschläge und Windrichtung zusammen, berücksichtigt Waldkarten, Gezeitenkalender und Satellitenbilder. Hinzu kommen die Turbinendaten über Leistung, Reparaturen und tatsächliche Laufzeiten der 50.000 Windräder, die Vestas bereits aufgestellt hat. Alles in allem fließen 160 Faktoren in die Analysen ein.

Flugzeugmotoren von Rolls-Royce tragen heutzutage nicht bloß Passagiere durch die Lüfte – sie hängen dabei auch laufend per Funk an einem Datennetz. Egal, wo auf der Welt ein Triebwerk gerade im Einsatz ist, schickt es einen steten Datenstrom an eine Zentrale im englischen Derby.

Die Motoren funken gleich auch mit, unter welchen Einsatzbedingungen sie gerade arbeiten, ob sie an einem Airbus A380 montiert sind oder an einer Boeing 747, und sobald ein Problem auftritt, analysieren die Techniker in Derby, was nach der nächsten Landung unternommen werden soll. Das geschieht auf der Basis riesiger Datenbanken, die mit der Nutzung weiter anschwellen – und die Auswertung geschieht, noch während das Flugzeug in der Luft ist. Das ist ein wesentliches Verkaufsargument für solche Motoren, weil die Fluggesellschaft nun mehrere Stunden Wartungszeit am Boden einsparen kann. Manchmal ist das nötige Ersatzteil schon auf dem Weg zum entsprechenden Flughafen, wenn das Problemtriebwerk noch gar nicht wieder am Boden ist.

300 Millionen Datensätze pro Woche

Die Drogeriemarktkette dm hat vor einiger Zeit die Umsatzströme mehrerer Jahre analysiert und weiß seither viel genauer, wann eine Filiale wie viel Personal braucht. Jahreszeiten, Feiertage und so fort werden im System berücksichtigt. Die Mitarbeiter können ihrerseits ihre Einsatzzeiten verlässlich vier bis acht Wochen im Voraus planen und müssen deutlich seltener als früher mit kurzfristig angeordneten Sonderschichten rechnen.

Der Versandhändler Otto verbessert mithilfe einer Spezialsoftware seine Bedarfsplanung für das gesamte Sortiment. Nach eigenen Angaben füttert das Unternehmen seine Software pro Woche mit 300 Millionen Datensätzen – und erstellt übers Jahr eine Milliarde Prognosen, wie sich der Absatz einzelner Artikel in den folgenden Tagen und Wochen entwickeln wird. Nach Konzernangaben ordert Otto durchschnittlich 30 Prozent weniger Ware als zuvor und hat dadurch deutlich weniger überschüssige Ware auf Lager. Von Einsparungen in zweistelliger Millionenhöhe ist die Rede.

Banken und Kreditkartenfirmen lassen große Datenmassen durchforsten, um Betrügern auf die Spur zu kommen. Manche überprüfen Hunderte von Millionen Webseiten – um zu verhindern, dass sich Webseiten von Betrügern als die Webseiten dieser Banken ausgeben und Kunden aufs Glatteis führen. Andere versuchen, Betrugsfälle in den Finanztransaktionen selbst zu finden – wobei verschiedenste Kriterien wie die Umsatzhöhe, der Ort, die Währung, der Zeitpunkt und so weiter herangezogen werden, um kriminelle Muster zu erkennen.

Und dann sind da all die frisch zu Marktführern aufgestiegenen Konzerne aus dem Internet, die ohnehin fast ausschließlich auf den Rohstoff »Datenmassen« setzen: Google, Facebook und Amazon beobachten ihre Kunden und die Besucher ihrer Websites bei jedem Schritt und jedem Klick, legen ihre Erkenntnisse in Datenspeichern ab – und entwickeln auf dieser Basis neue Dienstleistungen, weitere Produktempfehlungen und Werbeaktionen.

Problemlösungen aller Art dank Big Data

Die Zukunft solcher Konzerne, glauben viele, liegt im Erheben von noch mehr Informationen, aus noch mehr Quellen. So arbeiten einige dieser Firmen jetzt schon eifrig an der Erkennung von Gesichtern in den Strömen von Menschen, die durch Straßen oder Warenhäuser ziehen. Andere setzen darauf, dass Computer anhand unserer Mimik und Gestik verstehen lernen, wie wir uns gerade fühlen.

Der amerikanische Mobilfunk- und Internetkonzern Verizon hat kürzlich sogar ein Patent auf eine Technik angemeldet, die bestens zur Welt in Orwells Roman 1984 passt: »Wenn das System feststellt, dass ein Paar einen Streit hat, sendet es Anzeigen für Paartherapie auf den Fernseher oder auf ein Mobiltelefon im gleichen Raum«, heißt es in der Patentschrift. »Wenn das Paar offenbar miteinander schmust, würde es Werbung für ein romantisches Wochenende oder ein Verhütungsmittel erhalten.«

Für manchen Big-Data-Brancheninsider ist all das aber bloß der Anfang. Anthony Goldbloom gehört zu diesen Leuten. Der 30-jährige Australier, ein gelernter Ökonom und Statistiker, lebt seit einigen Jahren in San Francisco und ist dort Unternehmer geworden. 2010 hat er das Start-up Kaggle gegründet: eine Plattform für Problemlösungen aller Art – mithilfe von Big Data.