Kurzmitteilungen Software verrät das Geschlecht von Twitter-Nutzern
Forscher haben ein Programm entwickelt, das erkennt, ob ein Mann oder eine Frau eine 140-Zeichen-Mitteilung geschrieben hat. Werber dürfte das besonders interessieren.
© Yoschikazu Tsuno/AFP/Getty Images

"Twimal" ist ein Gadget eines japanischen Spielzeugherstellers, das Tweets vorlesen kann.
Twitter erlaubt es seinen Nutzern bekanntlich, seine Kurzmitteilungen in relativer Anonymität in die Welt zu versenden. Dennoch lässt sich mit hoher Trefferwahrscheinlichkeit sagen, welches Geschlecht sich hinter dem einen oder anderen Tweet verbirgt. Die Sprache verrät, ob ein Mann oder eine Frau die Zeile verfasst hat.
Das glauben zumindest John Burger, John Henderson, George Kim und Guido Zarrella. Sie haben ein Programm zur Geschlechtsermittlung von Tweets geschrieben. Vorgestellt haben es die Mitarbeiter des amerikanischen Non-Profit-Instituts MITRE auf der Conference on Empirical Methods in Natural Language Processing, die vergangene Woche in Edinburgh stattfand.
Unter dem Titel Discriminating Gender on Twitter beschreiben die Forscher, wie es ihnen gelungen ist, in 76 Prozent aller Fälle das richtige Geschlecht von Tweet-Schreiben zu ermitteln, selbst wenn es neben dem eigentlichen Text keinerlei weitere Information über den Autor gab.
Von allgemeinem Interesse ist das Vorgehen der Forscher vor allem, weil sie die Geschlechtsermittlungsarbeit einem Computer überlassen haben. Ihn haben sie anhand einer Vielzahl echter Tweets auf typisch männliche oder typisch weibliche Schreibstile trainiert.
Was Männer und Frauen so tippen
Am Ende spuckte die Software eine lange Reihe von Worten und Wortbestandteilen aus, die statistisch am meisten bei Männern oder Frauen vorkommen. Entlarvend ist demzufolge zum Beispiel die Verwendung des persönlichen Fürworts my. Logisch ist noch, dass ein Mann eher "my wife" schreibt und eine Frau eher "my husband". Aber in weiblichen Tweets tauchen offensichtlich auch deutlich häufiger die Kombination "my yoghurt" und "my yoga" auf, während bei Männern hinter my eher "zipper" oder "beer" folgen. Außerdem verwenden Frauen deutlich häufiger Smileys oder Ausrufezeichen als Männer. Frauen tippen "haha" und "love" und "feeling" in die Statusleiste. Männer hingegen deutlich öfter "http" und "google".
Ein paar Anwendungsmöglichkeiten für das Programm liegen auf der Hand: Man denke etwa an die vermeintliche Bloggerin "Gay Girl from Damasus", die zu Syriens bekanntester privaten Schreiberin wurde, nachdem sie über die Revolution in ihrer Heimat berichtet hatte. Dann stellte sich allerdings heraus, dass sich hinter der angeblich lesbischen Bloggerin aus Damaskus ein 40-jähriger Amerikaner mit Wohnsitz in Edinburgh verbarg. Auch die Tage von Männern, die sich als lesbische Frauen ausgeben, um sich so heimlich ans andere Geschlecht heranzuwanzen, könnten gezählt sein.
- Datum 01.08.2011 - 13:08 Uhr
- Seite 1 | 2 | Auf einer Seite lesen
- Quelle ZEIT ONLINE
- Kommentare 20
- Versenden E-Mail verschicken
- Empfehlen Facebook, Twitter, Google+
- Artikel Drucken Druckversion | PDF
-
Artikel-Tools präsentiert von:





von Männern, die sich als lesbische Frauen ausgeben, um sich so heimlich ans andere Geschlecht heranzuwanzen, könnten gezählt sein."]
Mist. Dann muss ich mir wohl ein neues Hobby suchen. Verdammte Technik!
dann klappt das schon noch :-D
dann klappt das schon noch :-D
dann klappt das schon noch :-D
Naja, das klingt jetzt nicht nach der super komplizierten Software (Texte nach der Häufigkeit von Benutzten Wörtern zu analysieren). Das bekommt man mit einer Seite Programmiercode hin.
dürften interessiert sein. Die Daten der sozialen Netzwerke sind eine anthropologische Goldgrube, um nicht zu sagen: eine annährend korrekte Momentaufnahme der westlichen Zivilisation.
Dennoch hab ich meine Zweifel, dass es zur Entwicklung verlässlicher Programme kommt, die anhand des Schreibstils die Identität eines bestimmten Menschen ausfindig machen. Die bei Twitter verwendeten Kriterien orientieren sich an statistischen Häufigkeiten - und viele Menschen entsprechen denen nicht oder nur zu kleinen Teilen. Außerdem dürfte es, wenn man sich mit den verwendeten Kriterien (und gelegentlich 'Klischees') auskennt, ein leichtes sein, sich zu 'verkleiden'. Das 'schwule Mädchen in Damaskus' hat auch Zigtausend intelligente Menschen täuschen können.
Da haben mal wieder ein paar Wissenschaftler das internett nicht verstanden.
Ist es nicht eher so das sich hintermehr als 25% ( mal ne sichere zahl nehmen ) der Accounts die sch Weiblich geben in wirklichkeit Männer steken ? warum auch imemr aber das Phänomen ist eigentlich in allen MMORPG's massenhaft zu beobachten.
Nur das ebend die "Männer" dann auch eher in ihrer Weibliche Rolle SChlüpfen und über jogort Joga und Gefühle schreiben, warscheinlich weil man das als "harter Mann" ebend nicht frei machen kann ohne als verweichlicht zu gelten.
Auch die Smily benutzung hängt eher von der Comunety ab, es bigt nun man chats in denen sie eher ein Satzendezeichen sind :) und es gibt chats in denen sie komplet verboten sind da sie als "nicht wissenschaftlich " gelten :)
Da nun grade Mentschn im internett gern die Möglichkeit nutzen auch mal der zu sein der sie in der richtigen Welt nicht sein können ^^ ist nun mal das Spiel mit der Mann/Frau rolle eins der Zentralen elemente der Netzes :)
Auch was ist dann mit textbausteinen und Versicherungsformulirtungen oder den Herren/Damen die lieber den Tweet mit:
"liebe Mitleser_Innen"
beginnen :? wobei das _ neuerdinds ja grade für die Mentschen stehen soll die sich Geschlechtlich niht festlegen können und so gantz alkuell super politisch Korrect sein soll :?
Ich glaub eher die Software entlarft die Vorurteile der Befölkerung das Frauen nicht von ihren Bier ertzählen was sie getrunken haben wärend die Fusball geschaut haben :)
Bitte prüfen Sie vor dem Absenden eines Kommentars, ob sie die orthographischen Regeln im Wesentlichen eingehalten haben und er somit problemlos lesbar ist. Danke, die Redaktion/se
Ihren Kommentar zu lesen hat richtig in den Augen wehgetan. Rechtschreibung scheint ein Fremdwort für Sie zu sein. Das war wirklich nicht schön was Sie mir zumuten.
Bitte diskutieren Sie das Artikelthema. Danke. Die Redaktion/lv
Ich zähle mich ja auch eher zur Kategorie der Orthographiefanatiker. Der Text liest sich allerdings nicht so, als könnte der Autor es ohne Wörterbuch besser machen. Ich könnte mich natürlich täuschen, aber hier sollte man doch wirklich etwas Nachsicht haben.
Ihren Kommentar zu lesen hat richtig in den Augen wehgetan. Rechtschreibung scheint ein Fremdwort für Sie zu sein. Das war wirklich nicht schön was Sie mir zumuten.
Bitte diskutieren Sie das Artikelthema. Danke. Die Redaktion/lv
Ich zähle mich ja auch eher zur Kategorie der Orthographiefanatiker. Der Text liest sich allerdings nicht so, als könnte der Autor es ohne Wörterbuch besser machen. Ich könnte mich natürlich täuschen, aber hier sollte man doch wirklich etwas Nachsicht haben.
Ach nee, sind ja nur 76%. Das hätte jeder Student *smile* mit ein bisschen Lebenserfahrung auch hinbekommen ;-) So zumindest mein Feeling!
Ihren Kommentar zu lesen hat richtig in den Augen wehgetan. Rechtschreibung scheint ein Fremdwort für Sie zu sein. Das war wirklich nicht schön was Sie mir zumuten.
Bitte diskutieren Sie das Artikelthema. Danke. Die Redaktion/lv
da haben Forscher ein Programm ausgefuxt, das zu 75% Wahrscheinlichkeit herausfindet als was sich Internet-User bzw. Userin ausgeben möchte. Welches Geschlecht (engl. gender). Schön. Wer hat den Twitter-Account / die Email Adresse wirklich? Reine Spekulation.
P.S. Und hoffen wir mal, dass Sie (die Zeit-Red.) bei der Anmerkung unter 5.) Recht hatten. Zu 75% haben Sie eineN LegasthenikerIn diskriminiert.
Sagt mir meine Erkennungssoftware ... :-)
Hat man etwas Fantasie und Sprachgefühl sollte es kein großes Problem sein zu Täuschen.
Jedenfalls müsste das Programm schon deutlich raffiniertere Tricks drauf haben als die genannten.
(Was nur ginge, wenn sich der Schreibstil von Frauen und Männern grundlegend unterscheidet. Ob das so ist? Bei SMS sind mir da schon einige Unterschiede aufgefallen, aber in Diskussionsforen z.B. nicht.)
Hat man etwas Fantasie und Sprachgefühl sollte es kein großes Problem sein zu Täuschen.
Jedenfalls müsste das Programm schon deutlich raffiniertere Tricks drauf haben als die genannten.
(Was nur ginge, wenn sich der Schreibstil von Frauen und Männern grundlegend unterscheidet. Ob das so ist? Bei SMS sind mir da schon einige Unterschiede aufgefallen, aber in Diskussionsforen z.B. nicht.)
Bitte melden Sie sich an, um zu kommentieren