Das Bundesamt für Migration und Flüchtlinge (Bamf) will in Zukunft möglicherweise mittels einer Software für Spracherkennung prüfen, ob die Dialekte von Asylbewerbern zu ihrer Herkunftsangabe passen. Das ist nicht nur ethisch fragwürdig, die Technik wird absehbar auch fehleranfällig sein.

Schon heute werden in Einzelfällen Sprachgutachten in Asylverfahren angefertigt, jedoch nicht von Maschinen, sondern von Menschen. Denn für die Beurteilung ist ein tiefes Wissen über die sprachliche Situation in den Herkunftsländern erforderlich. Das Bamf hält die Identität der Analysten geheim, es ist also nicht nachvollziehbar, ob diese Kenntnisse wirklich vorhanden sind. In manchen Fällen haben die Ergebnisse aber schon zu Abschiebeentscheidungen beigetragen, wie ein Analyst der Süddeutschen Zeitung sagte.

Sind Computer zuverlässiger als Menschen? Das will das Bamf erst noch herausfinden. Bis zum praktischen Einsatz der IT-gestützten Analyse werde es jedenfalls noch dauern, sagte Julian Detzel, Referent im Bereich Grundsatzstrategie Digitalisierung und IT-Programmmanagement des Bamf, der Welt. Erste Tests sollen in zwei Wochen beginnen. Auf Nachfrage von ZEIT ONLINE teilte das Bamf mit, es gehe zunächst um eine Machbarkeitsstudie ohne echte Daten von Asylbewerbern. Ob eine IT-gestützte Analyse zu einem späteren Zeitpunkt in der Praxis zum Einsatz kommen soll, sei noch nicht entschieden.

Allein in Syrien werden 18 Sprachen gesprochen

Mit welcher Software die Studie durchgeführt werden soll, beantwortete das Bundesamt auch auf mehrfache Nachfrage nicht. Man nutze "in der Zwischenzeit" keine Software, eine entsprechende Entwicklung stehe noch nicht an. Gleichzeitig teilte eine Sprecherin mit, als technologische Basis werde "eine bewährte Authentifizierungssoftware" genutzt.

Zudem müssten auch "eventuelle rechtliche Anpassungsbedarfe" noch evaluiert werden. Im Klartext heißt das: Das Bamf ist sich noch nicht sicher, ob eine automatische Sprachauswertung nach derzeitiger Gesetzeslage rechtlich zulässig wäre.

Die Entwicklung und das Training einer entsprechenden Software jedenfalls ist aus mehreren Gründen schwierig.

Erstens: In Ländern wie Syrien wird eine große Anzahl verschiedener Sprachen und Dialekte gesprochen. Die Linguistikforscher Gary F. Simons und Charles D. Fenning verzeichneten allein dort 18 aktiv gesprochene Sprachen und noch mehr Dialekte. Um die zuverlässig auseinanderhalten zu können, ist zunächst eine große Datenbasis erforderlich.

Kaum geeigneter als ein Würfelwurf

Welche Probleme computerbasierte Analysesysteme mit sich bringen, zeigen aktuelle Forschungsarbeiten. Linguisten versuchten, Hocharabisch und die vier verbreitetsten arabischen Dialekte anhand von Beispielen aus Nachrichtenbeiträgen auseinanderzuhalten. Ihre Software konnte die Audioaufnahmen zuverlässig in die Kategorien "Hocharabisch" und "Dialekt" einordnen, bei der Zuordnung zu einem bestimmten der vier Dialekte wiederum erzielten sie lediglich eine Genauigkeit von 60 Prozent. Bei den vielen syrischen Dialekten wird die Aufgabe entsprechend schwerer.

Zweitens ist Sprache lebendig und entwickelt sich fortlaufend weiter. Das gilt nicht nur für die Sprache einer Region, es gilt auch für die eines einzelnen Asylbewerbers. Der Linguistikprofessor Joachim Scharloth von der Technischen Universität Dresden sagt, die Sprache einer Person ändere sich auch noch nach der ersten Sozialisierung: "Jeder Sprachkontakt – und Migration bedingt sehr vielfältige Sprachkontakte – kann Auswirkungen auf die Sprachkompetenz haben."

Das heißt, in Krisenregionen und auf ihrer Flucht kommen Menschen mit vielen anderen aus unterschiedlichen Gebieten und Sprachräumen in Kontakt, was ihre Sprechweise beeinflusst und verändert. Gerade bei Menschen, die nicht ihr gesamtes Leben an einem einzigen Ort verbracht haben, vermischen sich Dialekte, sie übernehmen Eigenheiten regionaler Dialekte.

Sprachen halten sich nicht an Landesgrenzen

Drittens ergibt sich durch Soziolekte eine weitere Diversifizierung. Das sind Sprachvarianten, die sich in gesellschaftlichen Gruppen herausbilden: Jugendsprache unterscheidet sich von der Sprache älterer Menschen, die Sprache eines Akademikers von der eines Menschen ohne Schulbildung und verschiedene religiöse und politische Gruppen entwickeln sprachliche Eigenheiten, die kaum noch zu überblicken sind.

Verfolgung und Unterdrückung können die sprachliche Biografie eines Menschen zusätzlich prägen, wenn ein bestimmter Dialekt die Zugehörigkeit zu einer verfolgten und diskriminierten Gruppe verrät. Es kommt zu einer Anpassung an andere Dialekte, um nicht aufzufallen.

Eine vierte Schwierigkeit für eine automatisierte Analyse besteht darin, dass Menschen ihre Sprache je nach Situation und Gesprächspartner anpassen. Scharloth kritisiert, die Qualität der Daten, auf deren Basis ein Fall beurteilt werden soll, genüge häufig nicht den Ansprüchen: "Es handelt sich um Daten, die in formellen Kontexten wie einer Interviewsituation erhoben werden, häufig im Gespräch mit Nicht-Muttersprachlern oder Sprechern anderer Dialekte, was zu Akkomodationen führt, also zu Anpassungen an die Sprache des Gegenübers." Aber auch wenn das Bamf sein System mit Sprachproben trainieren sollte, die nicht direkt von Asylbewerbern stammen, müssten die Ergebnisse kritisch betrachtet werden.

Das Bamf will Menschen die endgültige Entscheidung treffen lassen

Und selbst angenommen, Menschen könnten durch eine Software einer Region zugeordnet werden, ergäbe sich ein weiteres Problem: Sprachen halten sich nicht an Landesgrenzen. Der Frankfurter Allgemeinen Zeitung sagte die jordanische Linguistin Enam Al-Wer, in der arabischen Welt seien viele Landesgrenzen mit dem Lineal gezogen worden. Das mache es unmöglich, zweifelsfrei festzustellen, ob jemand nun auf der einen oder der anderen Seite einer Grenze geboren ist – und auf syrische Asylbewerber übertragen: ob sie ihrem Herkunftsland Syrien zugeordnet werden, das 2017 bisher eine Schutzquote von 94,3 Prozent hat, oder Nachbarländern wie Jordanien mit deutlich schlechterer Bleibeperspektive.

Es zöge zudem ethische Probleme nach sich, wenn die Aussicht auf Asyl durch eine automatisierte, fehleranfällige Entscheidung beeinflusst würde. Auf Nachfrage sagt die Bamf-Sprecherin, es werde geprüft, ob die Analyse der Sprachproben als "zusätzliche, komplementäre Verifikation der Identität" eingesetzt werden kann. Die Software würde demnach nur als "Assistenzmittel", nicht als alleinige Entscheidungsgrundlage dienen. Ob aufgrund des vom Computer erkannten Dialektes auch das Herkunftsland bestimmt werden kann, müsse der zuständige Entscheider "auf Basis aller vorliegenden Fakten" beurteilen.