George Yu hat vor kurzem den Funktionsumfang seines iPhones erweitert. Der 30- jährige Ingenieur aus Chattanooga in Tennessee (USA) war schon immer ein leidenschaftlicher Tüftler, und vor ein paar Monaten hat er ein neues Gerät namens Node erfunden. Node ist etwa so groß und so rund wie eine Batterie, steckt in einer Hülle aus weißem Plastik und ist gespickt mit LED-Lämpchen, kleinen Schaltern und Sensoren. Per Funk steht es stets mit einem iPhone in Kontakt.

Wer ein Node-Gerät besitzt, kann fortan eine Menge über seine Umwelt erfahren. Das Ding kann zum Beispiel aus einem halben Meter Abstand das Fieber eines Kranken messen – und das Ergebnis erscheint auf dem Bildschirm des Telefons oder wahlweise gleich im Internet. Es kann auch feststellen, ob die Luftfeuchtigkeit in einem Terrarium stimmt oder ob die Geschwindigkeit und die Flughöhe eines Heißluftballons in Ordnung sind, ob die Wärmeisolierung eines Hauses leckt, ob Gas in der Küche austritt, ob irgendwo in der Nähe nukleare Brennstäbe herumliegen und derlei Dinge mehr. »Ich wollte ein Gerät mit unendlich vielen Anwendungen schaffen«, sagt Yu, der immerhin schon ein paar Hundert Nodes verkauft hat und sich nun an große Industriekunden wenden will.

Der Bastler Yu steht an der Spitze einer Entwicklung, die unser Leben zu verändern beginnt. Noch nie wurden pausenlos so viele Daten über die Menschen und die Welt gesammelt – auf so viele unterschiedliche Arten, aus so vielen unterschiedlichen Quellen. Und noch nie wurden sie derart eifrig archiviert, in riesenhaften Datenspeichern abgelegt und über Netzwerke verknüpfbar gemacht.

Alltagsgeräte wie Smartphones, Kameras, Stromzähler und Autos bekommen heutzutage schon recht genau mit, was um sie herum geschieht. Industriegeräte wie Fertigungsstraßen in Fabriken, voll automatisierte Warenlager, stadtweite Netzwerke aus Überwachungskameras und sogar Flugzeugmotoren helfen per Fühler, Chip und Datenleitung, die Welt zu vermessen – ohne menschliches Zutun, Daten-Puzzlestück für Daten-Puzzlestück. Und dann ist da ohnehin jener anschwellende Strom von Daten, die Menschen selber erzeugen und ins Internet einspeisen: Stimmungsmeldungen auf Facebook oder Twitter, Gesuche auf Jobportalen im Internet, Laufzeiten beim Jogging, Zwangsvollstreckungen, Gebote bei Online-Auktionen, Eingaben in Suchmaschinen wie Google, Inserate zur Partnersuche.

Neuer Goldrausch

»Wir schätzen, dass sich die Menge der Daten, die innerhalb eines Jahres erstellt, vervielfältigt und konsumiert werden, bis 2020 alle zwei Jahre verdoppelt«, heißt es bei der Unternehmensberatungsfirma IDC. Bloß meldet dieselbe Firma auch: Von all diesen Daten würden eigentlich bloß ein paar Prozent nutzbringend ausgewertet. Der Rest lande als Datenmüll in den Archiven – oder werde bald wieder gelöscht.

Aber wenn man in diesen Tagen IT-Unternehmern, Unternehmensberatungsfirmen und manchem elektrisierten Konzernchef zuhört, bekommt man den Eindruck: Die Zeiten ändern sich, es ist ein neuer Goldrausch ausgebrochen. Die Pioniere von heute graben keine Flusslandschaften mehr um wie vor mehr als hundert Jahren am Klondike, sondern sie baggern in digitalen Datenbergen. Ihre Mine nennen sie Big Data – den großen Datenhaufen.

»Big Data verändert das Wirtschaften an sich, und der Effekt ist enorm«, schwärmt James Manyika, Chef des McKinsey Global Institute, des Thinktanks der weltweit operierenden Unternehmensberatung. »Big Data ist größer als selbst das größte Unternehmen«, schrieb Phil Evans, der oberste Berater der Boston Consulting Group für die Computer-, Internet- und Medienindustrie, und prophezeite: »Big Data verschafft vielen westlichen Firmen einen Vorteil gegenüber aufstrebenden Wettbewerbern aus den Schwellenländern, weil westliche Konzerne mehr Daten gesammelt haben und besser darin sind, diese zu analysieren.« Die Erwartungen sind gewaltig.

Nun hat die heutige Datenflut tatsächlich eine Eigenschaft, die neu ist, die aber die Sache mit der Goldgräberei nicht gerade erleichtert: Sie stammt aus so vielen Quellen und bricht so schnell herein, dass sie völlig ungeordnet daherkommt.

Auch früher gab es in einigen Branchen schon gigantisch große Datensätze, aber sie waren wohlsortiert: Versicherungen, Ölexplorationsfirmen oder Handelsketten sammelten massenhaft Informationen über Transaktionen, Bohrungsdaten oder Regalbestände – und diese Daten wurden sorgfältig erhoben, ihren vorgesehenen Plätzen in der Datenbank des Unternehmens zugewiesen und nach etablierten Kriterien ausgewertet.