Big DataTwitter wird zum Fieberthermometer der Gesellschaft
Seite 2/2:

"More data is better data"

Der einzelne Tweet ist dabei bedeutungslos, es geht um die Masse. Oder, wie es die Autoren der Studie formulieren: "Der Informationsgehalt der meisten Botschaften ist sehr gering, aber die Aggregation von Millionen von Nachrichten kann entscheidendes Wissen hervorbringen."

Die größte Schwierigkeit dabei ist, in dieser Masse die sinnvollen Informationen zu finden. Der Ausdruck "Fieber" beispielsweise, im englischen fever , sei nicht wirklich hilfreich gewesen, sagte Michael Paul in einem Video zu der Untersuchung. Denn viele Nutzer bei Twitter seien vom sogenannten Bieber-Fever befallen, der Aufregung um den Sänger Justin Bieber .

Der Algorithmus musste also unterscheiden lernen – zwischen der ironischen Äußerung eines Popfans und der Mitteilung eines Kranken über seinen Zustand. Wobei letztere auch durchaus kryptisch daherkommen kann, beispielsweise in dem in der Studie als Beispiel zitierten Satz: " Had to pop a Benadryl....allergies are the worst....ughh. " Ein Mensch mag noch verstehen, dass da jemand eine Benadryl-Tablette eingenommen hat, um seine Allergie-Symptome zu mildern. Ein Computer aber hat mit diesem Verständnis seine Probleme.

Außerdem mussten die Forscher aussagekräftige Schlagworte identifizieren und verknüpfen, die im Zusammenhang mit einer Krankheit häufig verwendet werden. Der Algorithmus konnte schließlich aus der Häufigkeit solcher Begriffe und den Umständen ihrer Erwähnung die relevantesten Tweets identifizieren. Zusammen mit den bei Twitter gespeicherten Zusatzinformationen ergab sich ein umfassendes Bild zum Auftreten bestimmter Erkrankungen.

Kommunikationskanal für die ganze Gesellschaft

Solche Informationen könnten komplett den Weg verändern, wie man in Gesundheitsfragen Rückmeldungen von der Bevölkerung bekommt, sagte Mark Dredze in dem Video – Twitter wird so vom individuellen zum gesellschaftlichen Kommunikationskanal. Weswegen beispielsweise Geheimdienste enormes Interesse daran haben , diese Daten ebenfalls auszuwerten.

Die Studie enthält zum Beispiel eine Karte der US-Bundesstaaten, auf der die Allergie-Raten in den Monaten Februar, April, Juni und August sichtbar sind. Daran lassen sich gleichzeitig die Grenzen des Modells erkennen: Denn nicht in jedem Bundesstaat sind zu jedem Zeitpunkt genug relevante Tweets vorhanden. Erst wenn große Datenmengen einlaufen, werden diese statistisch signifikant.

Ob ein einzelner oder eine bestimmte Risikogruppe häufiger von einer Krankheit betroffen sind, kann der Algorithmus nicht errechnen; auch nicht, welcher Lebensstil mit Erkrankungen zusammenhängt. Die Frage, welche Medikamente am besten wirken, kann Twitter ebenso wenig beantworten. Dazu müssten einzelne Twitterer viele Nachrichten verschicken und den Krankheitsverlauf dokumentieren. 71 Prozent der Versuchspersonen hatten aber lediglich einen für die Analyse relevanten Tweet veröffentlicht.

"Je mehr Daten, desto besser" ( more data is better data ), ist der Schluss der Forscher daraus. Sie haben immerhin zwei Milliarden Tweets ausgewertet, die zwischen Mai 2009 und Oktober 2010 versendet wurden. Allerdings stellt diese hohe Zahl nur einen Bruchteil der vorhandenen Informationen dar. Nach Angaben von Twitter werden inzwischen täglich mindestens 50 Millionen Botschaften verschickt.

Zur Startseite
 
Leserkommentare
  1. dann wird wohl bald auch noch für die Nutzung von Twitter eine Praxisgebühr erhoben werden ;-))

    Eine Leserempfehlung
    Reaktionen auf diesen Kommentar anzeigen

    Diese Gefahr sehe ich nicht.

    Die Bundeskanzlerin wird Twitter nicht im CNetz finden können...

  2. Die Aussage dieses Artikels ist doch keine Überraschung. Wer mit etwas Kreativität die Entwicklungen beobachtet und "beweglich" genug ist, diese weiterzudenken, der ist sich bewußt, welche Revolution durch die neuen Medien gerade stattfindet. Das Thema besteht nämlich nicht nur aus Datensicherung und Urheberrecht oder Communities und Echtzeitdemokratie. Also: Aufpassen!

  3. 4. Um die

    Temperatur unseres Gesellschaftskörpers zu messen reichen mir persönlich zwei Sachen vollends aus:

    1. fünf wortlose Minuten auf einem Bahnhofsvorplatz meiner Wahl

    2. Der Kassenbon eines gefüllten Einkaufswagen kurz vor Ostern.

    8 Leserempfehlungen
    Reaktionen auf diesen Kommentar anzeigen

    ...

    Früher nannte man das einmal "Das Ohr am Puls der Zeit haben", oder "Dem Volk aufs Maul geschaut".

    Leider scheinen unsere heutigen politischen Protagonisten, auch in dieser Hinsicht, weit überwiegend hochgradig taub und blind zu sein!

    Gerry10 - Herzlichen Dank.

    KasperKlatsche - Ihren beiden Begriffe treffen die Sache auf den Punkt.

    Um unserere politischen Protagonisten mache ich mir keine großen Sorgen mehr. Die haben sich selbst oder von anderen auferlegte Problemchen zu lösen. Sie sind fast allumfassend von der Gesellschaft abgekoppelt.

    Das Jemand blind oder taub ist, gestehe ich Jedem zu.

    .... aber gefühllos .... das macht diese Kanditaten wieder gefährlich.

  4. Antwort auf "Um die"
  5. Das größte Problem wird darin bestehen, dass die Menschen die Sprache ändern werden - durch zum Beispiel kryptische Abkürzungen, weil sie nicht überwacht werden wollen bzw. über die Ausschüttung solcher Artikel wie hier immer mehr das Gefühl bekommen überwacht zu sein.

    Gut gemeint, aber bedenklich.
    Es wird immer mehr geben, die sich davon distanzieren werden.

    Kennt ihr das Gefühl lieber in der alten Zeit leben zu wollen!!??

    2 Leserempfehlungen
    Reaktionen auf diesen Kommentar anzeigen

    - "Kennt ihr das Gefühl lieber in der alten Zeit leben zu wollen!!??"

    Kenne ich. Und hatte mich schon gefragt, ob ich hier der Einzige bin, der ein mulmiges Gefühl bekommt angesichts dieser Entwicklung....

    Vermutlich kennen es fast alle älteren Menschen aller Zeiten - schon immer die, die von der "guten alten Zeit" sprechen.

    Es scheint aber, als ob es immer kürzere Zeit braucht, um die Welt der jeweils Nachgeborenen schon durch bloße Beschleunigung fremd werden zu lassen.

    Und auch zu Twitter gibt's das passende Goethe-Zitat:
    "Eisenbahnen, Schnellposten, Dampfschiffe und alle mögliche Fazilitäten der Kommunikation sind es, worauf die gebildete Welt ausgeht, sich zu überbieten, zu überbilden und dadurch in der Mittelmäßigkeit zu verharren. Und das ist ja auch das Resultat der Allgemeinheit, daß eine mittlere Kultur gemein werde."

  6. Es gibt bereits ein ähnliches Projekt bei dem Tweets bezüglich Migräne analysiert und mit Wetterdaten des DWD verglichen werden: http://www.migraene-radar...

    Eine Leserempfehlung
    Reaktionen auf diesen Kommentar anzeigen
    Redaktion

    Herzlichen Dank für den Hinweis und den Link, das Projekt kannte ich noch nicht. Interessant!

    lg
    Kai Biermann

Bitte melden Sie sich an, um zu kommentieren

  • Artikel Auf einer Seite lesen
  • Quelle ZEIT ONLINE
  • Schlagworte Google | Twitter | Justin Bieber | Medikament | Studie | Video
Service