Big Data : Twitter wird zum Fieberthermometer der Gesellschaft
Seite 2/2:

"More data is better data"

Der einzelne Tweet ist dabei bedeutungslos, es geht um die Masse. Oder, wie es die Autoren der Studie formulieren: "Der Informationsgehalt der meisten Botschaften ist sehr gering, aber die Aggregation von Millionen von Nachrichten kann entscheidendes Wissen hervorbringen."

Die größte Schwierigkeit dabei ist, in dieser Masse die sinnvollen Informationen zu finden. Der Ausdruck "Fieber" beispielsweise, im englischen fever , sei nicht wirklich hilfreich gewesen, sagte Michael Paul in einem Video zu der Untersuchung. Denn viele Nutzer bei Twitter seien vom sogenannten Bieber-Fever befallen, der Aufregung um den Sänger Justin Bieber .

Der Algorithmus musste also unterscheiden lernen – zwischen der ironischen Äußerung eines Popfans und der Mitteilung eines Kranken über seinen Zustand. Wobei letztere auch durchaus kryptisch daherkommen kann, beispielsweise in dem in der Studie als Beispiel zitierten Satz: " Had to pop a Benadryl....allergies are the worst....ughh. " Ein Mensch mag noch verstehen, dass da jemand eine Benadryl-Tablette eingenommen hat, um seine Allergie-Symptome zu mildern. Ein Computer aber hat mit diesem Verständnis seine Probleme.

Außerdem mussten die Forscher aussagekräftige Schlagworte identifizieren und verknüpfen, die im Zusammenhang mit einer Krankheit häufig verwendet werden. Der Algorithmus konnte schließlich aus der Häufigkeit solcher Begriffe und den Umständen ihrer Erwähnung die relevantesten Tweets identifizieren. Zusammen mit den bei Twitter gespeicherten Zusatzinformationen ergab sich ein umfassendes Bild zum Auftreten bestimmter Erkrankungen.

Kommunikationskanal für die ganze Gesellschaft

Solche Informationen könnten komplett den Weg verändern, wie man in Gesundheitsfragen Rückmeldungen von der Bevölkerung bekommt, sagte Mark Dredze in dem Video – Twitter wird so vom individuellen zum gesellschaftlichen Kommunikationskanal. Weswegen beispielsweise Geheimdienste enormes Interesse daran haben , diese Daten ebenfalls auszuwerten.

Die Studie enthält zum Beispiel eine Karte der US-Bundesstaaten, auf der die Allergie-Raten in den Monaten Februar, April, Juni und August sichtbar sind. Daran lassen sich gleichzeitig die Grenzen des Modells erkennen: Denn nicht in jedem Bundesstaat sind zu jedem Zeitpunkt genug relevante Tweets vorhanden. Erst wenn große Datenmengen einlaufen, werden diese statistisch signifikant.

Ob ein einzelner oder eine bestimmte Risikogruppe häufiger von einer Krankheit betroffen sind, kann der Algorithmus nicht errechnen; auch nicht, welcher Lebensstil mit Erkrankungen zusammenhängt. Die Frage, welche Medikamente am besten wirken, kann Twitter ebenso wenig beantworten. Dazu müssten einzelne Twitterer viele Nachrichten verschicken und den Krankheitsverlauf dokumentieren. 71 Prozent der Versuchspersonen hatten aber lediglich einen für die Analyse relevanten Tweet veröffentlicht.

"Je mehr Daten, desto besser" ( more data is better data ), ist der Schluss der Forscher daraus. Sie haben immerhin zwei Milliarden Tweets ausgewertet, die zwischen Mai 2009 und Oktober 2010 versendet wurden. Allerdings stellt diese hohe Zahl nur einen Bruchteil der vorhandenen Informationen dar. Nach Angaben von Twitter werden inzwischen täglich mindestens 50 Millionen Botschaften verschickt.

Verlagsangebot

Entdecken Sie mehr.

Lernen Sie DIE ZEIT 4 Wochen lang im Digital-Paket zum Probepreis kennen.

Hier testen

Kommentare

34 Kommentare Seite 1 von 5 Kommentieren

Wir werden noch staunen.

Die Aussage dieses Artikels ist doch keine Überraschung. Wer mit etwas Kreativität die Entwicklungen beobachtet und "beweglich" genug ist, diese weiterzudenken, der ist sich bewußt, welche Revolution durch die neuen Medien gerade stattfindet. Das Thema besteht nämlich nicht nur aus Datensicherung und Urheberrecht oder Communities und Echtzeitdemokratie. Also: Aufpassen!

Antwort

Gerry10 - Herzlichen Dank.

KasperKlatsche - Ihren beiden Begriffe treffen die Sache auf den Punkt.

Um unserere politischen Protagonisten mache ich mir keine großen Sorgen mehr. Die haben sich selbst oder von anderen auferlegte Problemchen zu lösen. Sie sind fast allumfassend von der Gesellschaft abgekoppelt.

Das Jemand blind oder taub ist, gestehe ich Jedem zu.

.... aber gefühllos .... das macht diese Kanditaten wieder gefährlich.