DemografieMit E-Mails lassen sich Auswanderer-Ströme messen

Wer wandert wohin aus? Bisherige Statistiken erfassen das nur schlecht. Zwei Forscher werteten E-Mails von Yahoo aus. Die Daten taugen sogar zur Vorhersage. von 

Wohin es Menschen weltweit zieht – das haben Emilio Zagheni, der beim Max-Planck-Institut für demografische Forschung arbeitet, und Ingmar Weber von Yahoo Research in Spanien , anhand von E-Mail-Daten untersucht. Die Methode funktioniere schneller und genauer als herkömmlich Systeme. "Solche Daten bergen das Potenzial, die Art zu revolutionieren, wie demografische Informationen gesammelt und interpretiert werden", schreiben die beiden Wissenschaftler in ihrer jetzt veröffentlichten Studie .

Sie werteten fast eine Milliarde E-Mails von 43 Millionen Mail-Accounts aus, beziehungsweise die darin enthaltenen Geodaten. Denn jede E-Mail ist mit der IP-Adresse des Absenders versehen, die auf den Ort schließen lässt, von der er sie abgeschickt hat. Zagheni und Weber nutzten Daten aus der Zeit zwischen September 2009 und Juni 2011, die Yahoo anonymisiert zur Verfügung gestellt hatte.

Anzeige

Die Hälfte der Accounts gehörte Bewohnern der USA , was nicht verwundert, da Yahoo im Vergleich zu anderen Ländern dort am stärksten genutzt wird. Für viele andere Länder, wie Deutschland oder Brasilien , bestand die Datenbasis aber immerhin noch aus 500.000 bis zwei Millionen Nutzern pro Land.

Dass die Menschen international mobiler werden, ist nicht nur Theorie. Zagheni und Weber fanden zum Beispiel klare Indizien dafür, dass der Anteil auswanderungswilliger Frauen steigt.

Grundlagenforschung zur Bevölkerungsstatistik

Doch ging es weniger darum, solche konkreten Aussagen zu treffen. Die Studie wollte vor allem klären, ob digitale Quellen überhaupt taugen, um demografische Fragen zu beantworten. Denn die Forschung in diesem Bereich hat ein Datenproblem.

Kai Biermann
Kai Biermann

Kai Biermann ist Redakteur im Team Investigativ/Daten bei ZEIT ONLINE. Seine Profilseite finden Sie hier.

"Wo Schätzungen internationaler Migration existieren, sind sie oft veraltet und stimmen kaum überein", sagt Demograf Emilio Zagheni. Staatliche Wanderungszahlen seien daher problematisch: "Migranten tendieren beispielsweise dazu, sich nach einem Umzug amtlich nicht oder erst sehr spät neu anzumelden. Zudem gibt es zwischen den Ländern bisher keine Übereinkunft, wann jemand überhaupt als Migrant definiert wird." Viele Länder würden solche Daten auch gar nicht registrieren.

Digitale Daten beispielsweise aus Twitter, Facebook oder eben aus E-Mails seien da viel schneller verfügbar und auch genauer.

Was trivial klingt, war es keineswegs. Denn um fundierte Aussagen zu treffen, reicht es nicht, einfach auszuzählen, wer von wo nach wo eine Mail verschickt hat. Bei der Auswertung solcher Daten gebe es gleich mehrere Probleme, schreiben die Forscher in ihrer Studie You are where you E-Mail: Using E-Mail Data to Estimate International Migration Rates .

Leserkommentare
  1. Untersuchung. Aber was ist mit den grossen Schleuserbanden, die Afrikaner in grossen Mengen, hausptsaechlich aus Laendern im Golf von Guinea nach Europa bringen, weil es ein Geschaeft ist. Da kann man wohl nicht von regulaerer Einwanderung sprechen.

  2. Schade das die Daten nicht ein bisschen gesäubert und in ein Analysetool gesteckt wurden (gapminder o.Ä.). Wäre nett als Abendbeschäftigung da drin zu stöbern.

    @Zeit: Ist ein Forschungspapier das sich mit der Möglichkeit der Analyse befasst. Ist mehr oder weniger ein "Proof of Concept".

    @marypastor PS: Ja die Welt ist schlecht und ungerecht, bitte Posts relativ nah am Thema (ja Nigeria hat eine hohe Mobilität ... das hat Irland, Spanien, Italien etc. auch ... ). Vielleicht können sie ja eine Qualitätsjournalisten mit Hintergrundinfos füttern, um einen erbaulichen Artikel draus zu bauen ... ansonsten halten sie es mit einem relativ bekannten dt. Comedian

  3. Das war einmal ein ordentlicher Artikel über Migration. Nun ja, es gibt tatsächlich keine ordentlichen Daten zur Migrationsräumen.

    Ich hätte da noch einige andere Artikel-Ideen:

    * Wie wäre es mit einem Artikel über transnationale migrantische Haushalte als informelle Risikogemeinschaften gegen starke Regenfälle und Ernteverluste ?

    * Wie nutzt die Weltbank Migration & Rücküberweisungen mittels future securization für die Staatsfinanzierung ?

    * Welchen Einfluss hat Migration auf die privaten Bildungsbudget in der Auswanderungsregion ?

    * Wie entwickelt sich Migration und GDP der grossen Einwanderungsländer langfristig ?

    * Wie beeinflusst Migration die Verbreitung von Technologie und medizinischen Wissens ?

  4. "Zagheni und Weber nutzten Daten aus der Zeit zwischen September 2009 und Juni 2011, die Yahoo anonymisiert zur Verfügung gestellt hatte." -- Wurde nach dem Einverständnis der User gefragt? Oder ist die freie Weitergabe der Daten an Dritte automatisch gegeben im Akzeptieren der AGBs?

    "Zudem gibt es zwischen den Ländern bisher keine Übereinkunft, wann jemand überhaupt als Migrant definiert wird." -- Wurde dieses Problem der Zuschreibung durch die Datenbenutzung von Yahoo-Usern unterlaufen?

    "Digitale Daten beispielsweise aus Twitter, Facebook oder eben aus E-Mails seien da viel schneller verfügbar und auch genauer." -- Wo "da"? Wie sollen die vorhandenen Daten (IP-Adresse, Alter, Geschlecht) Wanderungszahlen "genauer" widerspiegeln?

    "Im zweiten Schritt mussten sie Kriterien finden, die belegen, wann jemand umgezogen ist." -- Wie haben sie diese Kriterien anhand der vorhandenen Daten gefunden?

    "[Die Forscher] glichen ihre Daten beispielsweise mit denen von internationalen Flugbuchungen und von statistischen Ämtern ab." -- Welcher Art waren die Daten der internationalen Flugbuchungen? Handelt es sich um allgemeine Zahlen oder tatsächliche Buchungsdaten?

    "Wenn jemand viele Mails nach Deutschland schreibt, sagt Zagheri, hat er wahrscheinlich viele Freunde dort. Damit sei es durchaus wahrscheinlich, dass er eines Tages dorthin auswandert." -- Herr Zagheri arbeitet beim Max-Planck-Institut für demographische Forschung?

  5. Wissenschaftliche Forschung ist das eine - da können durchaus interessante Erkenntnisse gewonnen werden. Allerdings zeigt sich auch, was mit den Daten der User gemacht werden kann. Ansatzweise kann man erahnen dass wir dank Facebook, Freemailer und Co 24/7 überwacht werden können. Mit etwas Cross-Referencing lässt sich dann nachvollziehen, was jeder einzelne von uns heute morgen gefrühstückt hat und welches Duschgel er/sie benutzt, wann wohin gefahren wird, Freundeskreis etc.pp. Natürlich alles per Bildchen im Netz dokumentiert... schöne neue Welt!

  6. Das scheint ja ein reiches Betätigungsfeld für den Bundesbeauftragten für den Datenschutz und die Informationsfreiheit, Herrn P. Schaar und seine Mitarbeiter/innen zu werden.
    (Zitat aus der Veröff.: "Sie werteten fast eine Milliarde E-Mails von 43 Millionen Mail-Accounts aus, beziehungsweise die darin enthaltenen Geodaten. Denn jede E-Mail ist mit der IP-Adresse des Absenders versehen, die auf den Ort schließen lässt, von der er sie abgeschickt hat."
    Tja, offensichtlich gibt es in Deutschland bereits eine Vorratsdatenspeicherung.

Bitte melden Sie sich an, um zu kommentieren

  • Artikel Auf einer Seite lesen
  • Quelle ZEIT ONLINE
  • Schlagworte Yahoo | Google | Altersstruktur | Demografie | Facebook | Geodaten
Service