Keine Angst vor Roboter-Reportern – Seite 1

Künstliche Intelligenz (KI) meint die Digitalisierung menschlicher Wissensfähigkeiten. Sprache gehört dazu – und damit hat die Digitalisierung einen erheblichen Einfluss darauf, wie sich die Bewusstseinsindustrie und der Journalismus verändern. Wird über neue KI-Erfolge berichtet, reibt sich das menschliche Selbstverständnis inniglich an seinen Kreationen. Skepsis und Hoffnung wachsen im Gleichschritt: Überholt uns die Eigendynamik der weltweit entfesselten digitalen Kreativität? Hilft KI bei der Lösung der drängendsten Probleme unserer Zeit? Matthias Horx spricht von einem "humanen Minderwertigkeitskomplex" und dem Roboter als "Angstfreund". Sind wir noch Zauberer oder schon Zauberlehrling?

Intelligenz ist vielschichtig. In einer groben Klassifikation und ohne Anspruch auf Vollständigkeit kann man sensomotorische, kognitive, emotionale und soziale Fähigkeiten unterscheiden – und immer gehört Wissen dazu. Inhaltlich geht es sensomotorisch um das Gehen, Nehmen, Greifen oder das Balancieren, kognitiv um das Erinnern von Einsichten und das Einordnen von Fakten, emotional um das Verstehen und Erahnen der Gefühle und Einstellungen des Gegenübers und sozial um das Verhalten von und in Gruppen. In der Hoffnung haben wir darüber hinaus die Chance, auch kollektive Intelligenz zu entwickeln, denn die Gruppe ist mehr als die Gesamtheit ihrer Mitglieder – eine menschliche Chance, die allerdings oft durch menschliche Eitelkeit verpasst wird und deshalb nicht zu den erhofften inspirierten Ergebnissen führt.

Zwei Lesarten einer Vision

Die starke KI zielt auf das umfassende künstliche menschenähnliche Etwas – letztendlich der Homunculus, das künstliche Menschlein als Kopfgeburt. Dieser Ansatz trägt in sich die Frage nach dem Willen zur Macht – ein allzumenschlicher Wesenszug –, aber auch die Fragen nach dem eigenständigen maschinellen Selbstbewusstsein und der möglichen Übertragung des persönlichen Selbstbewusstseins auf eine Maschine, also letztendlich die digitale Unsterblichkeit. Hollywood ist dankbar und verkauft gerne unterhaltsam handlungsreiche, opulente Filme, in denen machtlüsterne Maschinen den Menschen zuerst überflügeln, um ihn dann in Reservate zu sperren oder auszurotten oder als Biokraftwerk und Energieproduzent zu missbrauchen. Viel Fiction, wenig Science.

 

Bei der schwachen KI – und das interessiert uns am DFKI – geht es nicht um das künstliche Bewusstsein, nicht um die Simulation des menschlichen Denkens; die schwache KI konzentriert sich auf einzelne konkrete Fähigkeiten und auf die Implementierung von nützlichen digitalen Assistenten, die den Menschen in seinen jeweiligen Handlungskontexten optimal unterstützen. Die schwache KI möchte helfen, dass Menschen ihre selbst gewählten Ziele besser, leichter oder mit einer höheren Qualität erreichen.

Computer eignen sich hervorragend für diesen Versuch, dieses Projekt, das seit über 60 Jahren immer mehr lernt über Alltagsintelligenz und die tatsächliche menschliche Verarbeitungsleistung. Was haben wir gelernt? Das KI-Paradoxon: Je leichter für den Menschen, desto schwerer für die Maschine. Menschen können vieles gleichzeitig, Maschinen können manches exzeptionell.

Wenn wir menschliche und maschinelle Wissensleistungen betrachten, müssen wir fair bleiben. Maschinen sehen den Wald und auch jeden Baum, haben aber ganz bestimmt kein Verständnis für die Poesie der Lichtung. Menschen sehen nicht nur Bilder, sondern denken eine ganze Geschichte dazu. Menschen hören nicht nur Worte, sondern immer auch eine Stimme – und bauen ein umfassendes Verständnis auf. Wobei wir eine gewisse Expertise entwickelt haben, die Übereinstimmung von Gesagtem und Gemeintem zu beurteilen, um so eine Vorstellung zu haben von dem Gedachten und dem Gewollten, um abzuleiten, inwiefern sich durch eine Äußerung die Welt verändert, in welche Richtung dies geschehen könnte und mit welchen Konsequenzen. Das können Maschinen – noch – nicht.

Maschinen haben keinen Sinn für Humor

Sprachtechnologie war seit den Anfängen im Jahr 1956 eine Herzensangelegenheit der KI und ist ein Kind des Kalten Krieges. Selbstverständlich waren die gedachten Anwendungen für maschinelle Übersetzung nicht Völkerverständigung, sondern Spionage und Gegenspionage. Die sinnerhaltende Übertragung eines quellsprachlichen in einen zielsprachlichen Text ist in den letzten zehn Jahren durch den Erfolg von maschinellen Lernverfahren und neuronalen Netzen sprunghaft besser geworden, die Anwendungen nützlich. Google Translate ist der meistgenutzte Übersetzungsdienst im Web und Apps wie zum Beispiel Fahum können Flüchtlingen vor Ort das Ankommen erleichtern und anfängliche Dialoge in bestimmten Lebenslagen in hoher Qualität unterstützen. Bei der freien Dialog- oder Textübersetzung allerdings ist die Sinnerhaltung noch nicht garantiert, Qualitätskontrolle notwendig. Die faktische, fachliche Übertragung wird in der Tat immer zutreffender, aber einen Sinn für Humor kann man nicht erwarten.

Trotzdem sind Mensch und Maschine meist Komplementäre. Beispielsweise können maschinelle Übersetzungen dabei helfen, fremdsprachliche Quellen zu erschließen. Die Übersetzung ist stilistisch und inhaltlich nicht perfekt, ermöglicht als Rohstoff aber eine erste Orientierung. Es wäre fahrlässig, sich in missionskritischen Entscheidungen auf automatisch übersetzte Texte zu verlassen. Für eine garantierte Übersetzungsqualität braucht man immer noch professionelle Übersetzer – das bedeutet in der Praxis: Die grenzkostenlose maschinelle Erstübersetzung gibt eine erste Idee und reduziert den Umfang und den finanziellen oder zeitlichen Aufwand für die bei Menschen beauftragte Übersetzung.

Nach den KI-Erfolgen in Schach, Jeopardy, Go und Poker kann man Maschinen in einigen Bereichen ein groß- oder weltmeisterliches Niveau nicht mehr absprechen. Sind am Ende Maschinen vielleicht auch die besseren Arbeitnehmer? Ohne gewerkschaftliche Bindung oder betriebliche Mitbestimmung – stromhungrig schon, aber ohne Tarifvertrag, Raucherpause und Urlaubsanspruch?

Maschinen sind selten kreativ

Gilt das auch im Journalismus? Die einfache Antwort lautet: Hier kann KI lediglich die Kernkompetenzen unterstützen, aber nicht kreativ ersetzen. Recherchieren, analysieren, schreiben, redigieren gehören dazu. KI liefert Komponenten und Wissenswerkzeuge, unterstützt bei Datenauswertung und Datenaufbereitung. Stichwort digitale Kuratierung. Dabei geht es um Sprach- und Wissenstechnologien, die die effiziente Verarbeitung, Erstellung und Verteilung qualitativ hochwertiger Medieninhalte in mehreren Dimensionen und Workflows unterstützen können.

Das Zusammenfassen von Texten hilft, die Relevanz von Inhalten schneller beurteilen zu können. Das automatische Glossar hilft, die Verwendung von Begriffen für sich, aber auch in der Redaktion zu harmonisieren. Das automatische Hyperlinking verbindet Texte mit Quellen und Begriffe mit Beispielen. Die automatische Analyse von Zeitausdrücken in einem Dokument kann helfen, die Chronologie der Ereignisse auf einen kompakten Zeitstrahl zu übertragen. Die automatische Erzeugung von Tabellen kann das Verständnis der in einem Text enthaltenen Daten durch eine übersichtliche Darstellung der Kernfakten erleichtern. Und natürlich kann man weitere Schritte gehen und die Textproduktion teil- oder vollautomatisieren.

Bei der maschinellen Erzeugung von Artikeln bleiben meist die tatsächliche Einordnung in aktuelle Entscheidungen oder Ereignisse unberücksichtigt. Je mehr die überraschend treffsichere Formulierung und kompakte Beschreibung gefragt ist, desto mehr steht die politische, kulturelle, die ökonomische Expertise, aber auch das rhetorische Talent des Autors, Journalisten oder Wissensarbeiters im Vordergrund. Denn der Leser schwimmt im Lesefluss und möchte auch unterhalten werden. Er könnte zu jeder Zeit aussteigen, deshalb ist es gut, den Leser zu kennen, seine tagesaktuellen Erwartungen und Informationsbedürfnisse zu erahnen. Aber jeder Leser ist anders. Roboterjournalismus ermöglicht auch personalisierte Artikel, also Texte, die automatisch an individuelle Interessen oder Lesegewohnheiten angepasst werden. Das kann Inhalte online für den einzelnen Leser besser zugänglich und letztendlich die Mühen der Recherche lohnenswerter machen, kann aber auch propagandistisch für politische Kampagnen missbraucht werden.

Missbrauch für Propaganda?

Ein Artikel ist ein Zeitdokument mit bedingter Haltbarkeit und muss primär zum Zeitpunkt der Veröffentlichung funktionieren. Deshalb baut der Journalist auf das gemeinsame Weltwissen der Gegenwart und nimmt bestimmte Fakten bei seiner Leserschaft als allgemein bekannt an. Oder geht davon aus, dass sie schon wieder vergessen wurden. Deshalb wird bei jeder Bundestagswahl – wahrscheinlich zu Recht – immer wieder das Überhangmandat erläutert, obwohl die übergroße Gruppe diese Erklärung schon gehört, aber möglicherweise auch schon wieder vergessen hat. Eine Maschine hat kein inniges Verständnis von hilfreich erfreulicher Redundanz, keine Vorstellung von langweilig zeitraubender Wiederholung – obwohl das in Wirklichkeit alles nicht so eindeutig ist, denn eine Maschine könnte die korrekten Ergebnisse auch ganz ohne Verständnis, sondern nur durch die Analyse von Massendaten herstellen. Wenn das Konzept des Überhangmandats vorhersehbar drei Wochen vor einer Bundestagswahl erläutert und gelesen wird, könnte der Rechner einen entsprechenden Artikel formulieren und zum passenden Zeitpunkt vorschlagen. KI könnte damit durchaus interessante Vorschläge für Timing und Inhaltsplanung liefern.

Natürlich kann man strukturierte Information aus Datenbanken maschinell in Texte überführen und natürlich sind diese Texte mittlerweile lesbar, selbstverständlich nicht literarisch anspruchsvoll. Erfolgskritisch ist die spezifische Textsorte und das Verständnis der Lesegewohnheiten. Ausgeschlossen scheint die robotisch erzeugte Reportage, die Glosse, der Kommentar oder Leitartikel. Je strukturierter die Information für die Textbasis ist, je datengetriebener und faktenbehafteter der Gegenstandsbereich, je größer die Bedeutung statistischer Information für die Einordnung von aktuellen Ereignissen in zurückliegende Vorkommnisse, desto höher ist die Chance, die Erstellung von zumindest lesbaren und hoffentlich lesenswerten Artikeln zu automatisieren. Man wird schwerlich aus einem tabellarischen Lebenslauf einen Personality Artikel erzeugen können, aber in der Unternehmenszeitung könnte in der Rubrik "Willkommen an Bord" ein automatisch erzeugter Text erscheinen, der den neuen Mitarbeiter mit seinen Kompetenzen und Aufgaben vorstellt – wahrscheinlich möglich, aber garantiert pietätlos wäre die automatische Erzeugung eines Nachrufs.

Eine publizistische Chance für die Demokratisierung der Berichterstattung

Und daher haben sich bisher auch nur wenige Nischen für die Automatisierung der Textproduktion als geeignet gezeigt: Sport, Wetter, Börse. So könnte man aus meteorologischen Daten hyperlokale Wetterberichte erzeugen, aus aktuellen Börsendaten Artikel über einzelne Aktien oder eben Sportberichte maschinell produzieren. Die Ansammlung von faktischen Informationen ist hoch, die Texte sind weitgehend standardisiert, die Lesegewohnheiten beziehungsweise -erwartungen sind bekannt.

Hier ein Beispiel von Radio Hamburg:

"Mit 42 Punkten auf der Habenseite steht NTSV II derzeit auf dem sechsten Rang. Der Gastgeber verbuchte insgesamt zwölf Siege, sechs Remis und zehn Niederlagen. Bei der Elf von Trainer Matthias Jobmann präsentiert sich die Abwehr immer wieder wackelig. Allerdings trifft die Offensive dafür auch gerne ins gegnerische Tor. Nur einmal ging Niendorfer TSV II in den vergangenen fünf Partien als Sieger vom Feld. TSV Sparrieshoop findet sich derzeit in der unteren Tabellenhälfte wieder: Rang elf. Der Gast konnte bisher nur 17 Zähler auf fremden Plätzen holen. Neun Siege, fünf Remis und 14 Niederlagen hat die Mannschaft von Coach Christian Kullock derzeit auf dem Konto. Zuletzt gewann Sparrieshoop etwas an Boden. Zwei Siege und ein Unentschieden schaffte TSV Sparrieshoop in den letzten fünf Spielen. Um das letzte Drittel der Tabelle zu verlassen, muss Sparrieshoop diesen Trend fortsetzen."

Vorstellbar ist die Erzeugung von Spielberichten in Echtzeit und noch während der Live-Begegnung. Die aktuelle Voraussetzung ist die strukturierte digitale Erfassung der einzelnen Spielereignisse durch Betreuer, Trainer oder engagierte Fans. In Zukunft könnten sensorisch angereicherte Trikots – auch bei Bezirksligaspielen – automatisch Daten übermitteln, die dann in Texte überführt würden. Natürlich hat das Grenzen. Die Daten können Zustände mitteilen, aber nicht Aktionen interpretieren. Man wüsste, mit welcher Geschwindigkeit und in welche Richtung ein Ball beschleunigt wurde, weiß aber nicht, ob diese Aktion im tatsächlichen Spielzusammenhang eigentlich eine taktische Finte oder ein faktischer Fehlpass war. Die Interpretation bleibt die Aufgabe des Betreuers – und unterschiedliche Beurteilungen führen gerne zu Auseinandersetzungen mit und zwischen den Eltern der jugendlichen Sportler. 

Roboterjournalismus kann über Content-Automatisierung zur Demokratisierung von Berichterstattung beitragen, kann neue publizistische Räume erschaffen, zusätzliche Werbeeinnahmen realisieren. Fließtext fördert Leselust. Roboterjournalismus kann neue Leser und Information erschließen und helfen, Inhalte leichter zu erfassen, breiter zu verteilen. Die sequentielle Form entspricht den Berichterstattungs- und Kulturgewohnheiten und der veröffentlichte Artikel adelt die lokalen Ereignisse, über die aus nachvollziehbaren Kostengründen kein Journalist und kein Medium berichtet hätte.

Robotic Generated Text

Der erzeugte Artikel kann nur so korrekt sein, wie die faktische Basis. Deshalb nimmt der Faktencheck an Bedeutung zu und so könnte das Interview, die wichtige Frage zum richtigen Zeitpunkt, und die Recherche – unterstützt durch digitale Kuratierung – wieder mehr ins Zentrum der journalistischen Arbeit rücken. Die eigentliche handwerkliche Schreibarbeit könnte an Bedeutung verlieren. KI könnte die Erstellung des ersten Artikelkandidaten leisten, der dann von dem Journalisten auf-, über- und umgearbeitet wird.

Wie werden Leser reagieren, wenn die maschinelle Artikelproduktion an Fahrt aufnimmt? Ist es für den Leser maßgeblich zu wissen, ob der Text von einer Maschine produziert oder von einem Menschen geschrieben wurde? Faktisch wahrscheinlich nicht, emotional möglicherweise schon. Als Beitrag zur Transparenz könnte man einen Hinweis, einen Marker einführen – beispielsweise Robotic Generated Text – sodass der Leser proaktiv informiert ist, dass kein Mensch, sondern eine Software diesen Artikel erzeugt hat. Retresco, ein Berliner Technologielieferant, nimmt für sich in Anspruch, Artikel vollautomatisiert und mit angemessener Qualität erstellen zu können: "Die hohe natürlichsprachliche Qualität der Texte aus der rtr textengine macht das prüfende Auge des Redakteurs entbehrlich." 

Automatische Produktion ist oft eigentlich semiautomatisch. Fraglich wäre, ab welchem Automatisierungsgrad eine freiwillige Kennzeichnungspflicht einsetzen würde. Nur für den vollautomatisierten Prozess oder auch für eine teilautomatisierte Textproduktion? Das wirft Fragen auf: Handelt es sich auch dann um einen robotischen Text, wenn lediglich die Schlussredaktion bei einem Menschen liegt? Für den Fall, dass ein Redakteur einen Artikel überfliegt und freigibt, handelt es sich dann um Roboterjournalismus oder um Redakteur-Roboter-Kollaboration?

Schlau und intelligent sind nicht dasselbe

Die Frage, wie man die intelligente Maschine als solche erkennen kann, stellt sich seit den Anfängen der KI-Forschung und eine präzise Antwort steht aus, auch weil es keine präzise Definition von "Intelligenz" gibt. Aber die Annäherung von John McCarthy, einem der Gründerväter der KI, ist immer noch eine gute Arbeitshypothese: Eine Maschine ist dann intelligent, wenn sie etwas tut, für das man beim Menschen Intelligenz voraussetzen würde.

Oder in Anlehnung an Forrest Gump: Schlau ist der, der Schlaues schreibt! Aber schlau und intelligent sind nicht dasselbe. Schlau ist überraschend, oft humorvoll, prägnant und brillant, Zeichen einer raschen Auffassungsgabe. Intelligent ist eher folgerichtig, schlüssig, in sich konsistent und ohne argumentative Fehler. Und so würde man auch die Ergebnisse erwarten: korrekte Texte von Maschinen, die dem Leser helfen, Inhalte schneller zu erschließen als durch das Studium von Tabellen und Zahlenkolonnen. Schlaue Artikel von Journalisten, die originelle Einsichten vermitteln, neue Welten erschließen oder komplexe Zusammenhänge auf einen überraschenden Punkt bringen, die dem Leser eine Haltung anbieten, die man teilen oder ablehnen kann, aber über die es sich lohnt nachzudenken.

Der Artikel ist die Festrede zum 30. Journalistentag der Deutschen Journalistinnen- und Journalisten Union in ver.di vom 21. Januar 2017.