Der einzelne Tweet ist dabei bedeutungslos, es geht um die Masse. Oder, wie es die Autoren der Studie formulieren: "Der Informationsgehalt der meisten Botschaften ist sehr gering, aber die Aggregation von Millionen von Nachrichten kann entscheidendes Wissen hervorbringen."

Die größte Schwierigkeit dabei ist, in dieser Masse die sinnvollen Informationen zu finden. Der Ausdruck "Fieber" beispielsweise, im englischen fever , sei nicht wirklich hilfreich gewesen, sagte Michael Paul in einem Video zu der Untersuchung. Denn viele Nutzer bei Twitter seien vom sogenannten Bieber-Fever befallen, der Aufregung um den Sänger Justin Bieber .

Der Algorithmus musste also unterscheiden lernen – zwischen der ironischen Äußerung eines Popfans und der Mitteilung eines Kranken über seinen Zustand. Wobei letztere auch durchaus kryptisch daherkommen kann, beispielsweise in dem in der Studie als Beispiel zitierten Satz: " Had to pop a Benadryl....allergies are the worst....ughh. " Ein Mensch mag noch verstehen, dass da jemand eine Benadryl-Tablette eingenommen hat, um seine Allergie-Symptome zu mildern. Ein Computer aber hat mit diesem Verständnis seine Probleme.

Außerdem mussten die Forscher aussagekräftige Schlagworte identifizieren und verknüpfen, die im Zusammenhang mit einer Krankheit häufig verwendet werden. Der Algorithmus konnte schließlich aus der Häufigkeit solcher Begriffe und den Umständen ihrer Erwähnung die relevantesten Tweets identifizieren. Zusammen mit den bei Twitter gespeicherten Zusatzinformationen ergab sich ein umfassendes Bild zum Auftreten bestimmter Erkrankungen.

Kommunikationskanal für die ganze Gesellschaft

Solche Informationen könnten komplett den Weg verändern, wie man in Gesundheitsfragen Rückmeldungen von der Bevölkerung bekommt, sagte Mark Dredze in dem Video – Twitter wird so vom individuellen zum gesellschaftlichen Kommunikationskanal. Weswegen beispielsweise Geheimdienste enormes Interesse daran haben , diese Daten ebenfalls auszuwerten.

Die Studie enthält zum Beispiel eine Karte der US-Bundesstaaten, auf der die Allergie-Raten in den Monaten Februar, April, Juni und August sichtbar sind. Daran lassen sich gleichzeitig die Grenzen des Modells erkennen: Denn nicht in jedem Bundesstaat sind zu jedem Zeitpunkt genug relevante Tweets vorhanden. Erst wenn große Datenmengen einlaufen, werden diese statistisch signifikant.

Ob ein einzelner oder eine bestimmte Risikogruppe häufiger von einer Krankheit betroffen sind, kann der Algorithmus nicht errechnen; auch nicht, welcher Lebensstil mit Erkrankungen zusammenhängt. Die Frage, welche Medikamente am besten wirken, kann Twitter ebenso wenig beantworten. Dazu müssten einzelne Twitterer viele Nachrichten verschicken und den Krankheitsverlauf dokumentieren. 71 Prozent der Versuchspersonen hatten aber lediglich einen für die Analyse relevanten Tweet veröffentlicht.

"Je mehr Daten, desto besser" ( more data is better data ), ist der Schluss der Forscher daraus. Sie haben immerhin zwei Milliarden Tweets ausgewertet, die zwischen Mai 2009 und Oktober 2010 versendet wurden. Allerdings stellt diese hohe Zahl nur einen Bruchteil der vorhandenen Informationen dar. Nach Angaben von Twitter werden inzwischen täglich mindestens 50 Millionen Botschaften verschickt.