Das Bundesamt für Migration und Flüchtlinge (Bamf) will in Zukunft möglicherweise mittels einer Software für Spracherkennung prüfen, ob die Dialekte von Asylbewerbern zu ihrer Herkunftsangabe passen. Das ist nicht nur ethisch fragwürdig, die Technik wird absehbar auch fehleranfällig sein.

Schon heute werden in Einzelfällen Sprachgutachten in Asylverfahren angefertigt, jedoch nicht von Maschinen, sondern von Menschen. Denn für die Beurteilung ist ein tiefes Wissen über die sprachliche Situation in den Herkunftsländern erforderlich. Das Bamf hält die Identität der Analysten geheim, es ist also nicht nachvollziehbar, ob diese Kenntnisse wirklich vorhanden sind. In manchen Fällen haben die Ergebnisse aber schon zu Abschiebeentscheidungen beigetragen, wie ein Analyst der Süddeutschen Zeitung sagte.

Sind Computer zuverlässiger als Menschen? Das will das Bamf erst noch herausfinden. Bis zum praktischen Einsatz der IT-gestützten Analyse werde es jedenfalls noch dauern, sagte Julian Detzel, Referent im Bereich Grundsatzstrategie Digitalisierung und IT-Programmmanagement des Bamf, der Welt. Erste Tests sollen in zwei Wochen beginnen. Auf Nachfrage von ZEIT ONLINE teilte das Bamf mit, es gehe zunächst um eine Machbarkeitsstudie ohne echte Daten von Asylbewerbern. Ob eine IT-gestützte Analyse zu einem späteren Zeitpunkt in der Praxis zum Einsatz kommen soll, sei noch nicht entschieden.

Allein in Syrien werden 18 Sprachen gesprochen

Mit welcher Software die Studie durchgeführt werden soll, beantwortete das Bundesamt auch auf mehrfache Nachfrage nicht. Man nutze "in der Zwischenzeit" keine Software, eine entsprechende Entwicklung stehe noch nicht an. Gleichzeitig teilte eine Sprecherin mit, als technologische Basis werde "eine bewährte Authentifizierungssoftware" genutzt.

Zudem müssten auch "eventuelle rechtliche Anpassungsbedarfe" noch evaluiert werden. Im Klartext heißt das: Das Bamf ist sich noch nicht sicher, ob eine automatische Sprachauswertung nach derzeitiger Gesetzeslage rechtlich zulässig wäre.

Die Entwicklung und das Training einer entsprechenden Software jedenfalls ist aus mehreren Gründen schwierig.

Erstens: In Ländern wie Syrien wird eine große Anzahl verschiedener Sprachen und Dialekte gesprochen. Die Linguistikforscher Gary F. Simons und Charles D. Fenning verzeichneten allein dort 18 aktiv gesprochene Sprachen und noch mehr Dialekte. Um die zuverlässig auseinanderhalten zu können, ist zunächst eine große Datenbasis erforderlich.

Kaum geeigneter als ein Würfelwurf

Welche Probleme computerbasierte Analysesysteme mit sich bringen, zeigen aktuelle Forschungsarbeiten. Linguisten versuchten, Hocharabisch und die vier verbreitetsten arabischen Dialekte anhand von Beispielen aus Nachrichtenbeiträgen auseinanderzuhalten. Ihre Software konnte die Audioaufnahmen zuverlässig in die Kategorien "Hocharabisch" und "Dialekt" einordnen, bei der Zuordnung zu einem bestimmten der vier Dialekte wiederum erzielten sie lediglich eine Genauigkeit von 60 Prozent. Bei den vielen syrischen Dialekten wird die Aufgabe entsprechend schwerer.

Zweitens ist Sprache lebendig und entwickelt sich fortlaufend weiter. Das gilt nicht nur für die Sprache einer Region, es gilt auch für die eines einzelnen Asylbewerbers. Der Linguistikprofessor Joachim Scharloth von der Technischen Universität Dresden sagt, die Sprache einer Person ändere sich auch noch nach der ersten Sozialisierung: "Jeder Sprachkontakt – und Migration bedingt sehr vielfältige Sprachkontakte – kann Auswirkungen auf die Sprachkompetenz haben."

Das heißt, in Krisenregionen und auf ihrer Flucht kommen Menschen mit vielen anderen aus unterschiedlichen Gebieten und Sprachräumen in Kontakt, was ihre Sprechweise beeinflusst und verändert. Gerade bei Menschen, die nicht ihr gesamtes Leben an einem einzigen Ort verbracht haben, vermischen sich Dialekte, sie übernehmen Eigenheiten regionaler Dialekte.