Analyse

Kann ein Computer Gedichte schreiben?

Trotz anerkannter Verfahren zur automatischen Poesieerzeugung mittels Technik kann die Frage nicht eindeutig beantwortet werden. beleuchtet das Thema

Wir leben in einer schnelllebigen Zeit, eine rasche Antwort ist gefordert: Nein, er kann es nicht - zumindest nicht sehr gut, besonders, wenn man gewisse literarische Ansprüche stellt. Was heißt aber "literarische Ansprüche"? Wann ist ein Gedicht ein Gedicht? Was bedeutet Kreativität? Fragen über Fragen, die auch ohne große Sachkenntnis endlos diskutiert werden können. Kann man wissenschaftlich sinnvoll dazu Stellung nehmen? Ich glaube, ja. Denn: Mittlerweile gibt es verschiedene anerkannte Verfahren zur automatischen Gedichterzeugung mittels Computer, und 2003 wurde an der renommierten School of Informatics der University of Edinburgh ein junger Mann mit einer Arbeit zum Doctor of Philosophy promoviert, deren Thema die Erzeugung von Gedichten mittels Computer war. Nein - nicht die Frage nach der Möglichkeit. Als Ergebnis der Dissertation entstand ein Programm, das Gedichte schreibt. Der Autor, Hisar Maruli Manurung, ist außerhalb von Fachkreisen weitgehend unbekannt. Bekannter ist Hans Magnus Enzensberger, der sich schon um 1974 mit der Frage der Möglichkeit eines Poesieautomaten beschäftigt hat. Enzensberger war aber nicht der erste, wie er selbst in seiner Arbeit anmerkt: Spekulationen gibt es nachgewiesenermaßen seit 1777, aber erst in den letzten Jahren hat die Forschung auf diesem Gebiet einen Aufschwung erfahren, der mit der Rolle der automatischen Sprachverarbeitung im Rahmen der Artificial Intelligence-Forschung in einem engen Zusammenhang steht.

Literatur und Informatik

Berührungspunkte zwischen Literatur und Informatik gibt es schon lange. Oft nehmen dabei Schriftsteller indirekt Entwicklungen in der Informatik vorweg. Ein Beispiel dafür ist Andreas Okopenkos "Lexikonroman", der auf unzählige Arten gelesen werden kann, je nachdem, welchen der Querverweisen in den einzelnen Artikeln, die lexikonartig alphabetisch organisiert sind, man wann folgt. Zur Zeit als der Roman entstand, existierte der Begriff noch nicht, heute denkt man sofort an Hypertext bzw. das Internet und seine verlinkten Seiten. Ähnliches thematisiert Borges in seinem "Sandbuch", einem Buch, in dem die ganze Welt enthalten ist, eine einmal aufgeschlagene Seite aber praktisch nicht mehr wieder auffindbar ist - hier ist die Informatik allerdings seit dem Auftreten der Suchmaschinen einen Schritt weiter gekommen... Eine andere Idee ist die des Computers als Werkzeug für den Dichter, angedacht schon bei Paul Valéry, prototypisch ausgeführt von Franz Josef Czernins Poe - einem Programm, das dem Dichter Textvorschläge liefern sollte, die genau festgelegten metrischen, morphologischen, syntaktischen oder semantischen Restriktionen genügen. Der "selbsttätig" dichtende Computer geht aber einen Schritt weiter.

Die Phantasie vom "intelligenten" Computer

Enzensberger hat in seiner oben erwähnten Schrift u.a. literarische und medientheoretische Aspekte angesprochen. Der informatische Begriff, der sich heute bei automatischer Gedichterzeugung aufdrängt, ist der der Artificial Intelligence. Der Computer faszinierte von Anfang an durch seine Möglichkeiten als "denkende", "intelligente" Maschine, wobei sich aber mit der Zunahme der Fähigkeiten des Computers, d.h. mit der Erstellung komplexerer Programme, die oft qualitative Sprünge darstellten, der Intelligenzbegriff stets verlagerte: galten vor der Verbreitung des elektronischen Taschenrechners Fertigkeiten im (Schnell-) Rechnen noch als intelligent, änderte sich diese Auffassung rasch. Der nächste Schritt war der Wunsch nach einem Computer, der nicht nur schnell rechnen konnte, sondern auch planen - nachgewiesen etwa durch die Fähigkeit zum Schachspiel. Mit dem Aufkommen von immer besseren Schachprogrammen auf Meister- und auch Großmeisterniveau hat sich der Intelligenzbegriff neuerlich gewandelt: nun wird auf Kreativität abgestellt, auf künstlerische Fertigkeiten, wie etwa die Komposition von Musik oder auch das Schreiben von Gedichten. Es sei aber angemerkt, dass schon Alan Turing in seiner klassischen Arbeit aus dem Jahre 1950 die Fähigkeit zum Umgang mit Sprache als Inbegriff von und Maß für Intelligenz ansah. In der Folge entstanden immer wieder Diskussionen darüber, ob Computer Sprache "verstehen" können.

Verstehen oder nicht? Eine Scheinfrage?

Searle hat die Frage provokant durch sein "Chinese Room Argument" zugespitzt: ein Mensch, dem Fragen in chinesischer Schrift präsentiert werden, die er nicht versteht, der aber mit Hilfe von genau festgelegten Regeln in der Lage ist, wieder Antworten auf Chinesisch zu Papier zu bringen, versteht nach Searle genauso wenig chinesisch, wie ein Computer, der letztendlich nur Symbole manipuliert. Die in der Folge entstandene Literatur pro und contra Searle ist reichhaltig. Unabhängig von der letztgültigen Beantwortung der Frage, ob der Computer jetzt "versteht" oder nicht, hat sich aber die Artificial Intelligence längst als angesehene Forschungsdisziplin etabliert. Einer ihrer Zweige ist die automatische Sprachverarbeitung, und zwar nicht nur von gesprochener Sprache (Diktiersysteme, Sprachsynthese), sondern auch von schriftlichen Texten - Analyse und Generierung.

Wenn man so will, stellt die automatische Erzeugung von Gedichten einen Sonderfall automatischer Textgenerierung dar. Normalerweise geht es bei der Textgenerierung aber nicht um ästhetische Fragen, sondern um Gebrauchstexte: Erzeugung von technischen Berichten, Gebrauchsanweisungen, Wetterberichten, aber auch das Gebiet der automatischen Übersetzung - mit all seinen Schwächen, auf die einzugehen hier zu weit führen würde - hat mit automatischer Textgenerierung zu tun.

Automatische Gedichterzeugung

Eine der ersten Erwähnungen automatischer Gedichterzeugung findet sich bei Margaret Masterman. Sie beschrieb im Jahr 1971 ein Programm, das automatisch Haikus erzeugt, eine japanische Gedichtform, die einem strengen dreizeiligen Schema mit Silbenzahlen von 5-7-5 folgt. Das Programm ist höchst simpel: Ein Schablone mit Leerstellen ist vorgegeben, wobei in die Leerstellen zufällig Wörter eingesetzt werden, die den angegebenen Silbenzahlen entsprechen. Die Methode fand zahlreiche Nachahmer und Variationen, so die von der Alamo-Gruppe verfassten Rimbaudelaires, Sonette mit der Satzstruktur von Rimbaud, aufgefüllt mit einem Vokabular von Baudelaire. Interessanterweise korreliert die Qualität des Ergebnisses nicht immer mit der Komplexität der verwendeten Methode: so wurden manche von Mastermans Haikus von Lesern eher akzeptiert als mit weitaus aufwändigeren Verfahren hergestellte Gedichte.

Schablonenbasierte Erzeugung von Gedichten ist vom Standpunkt der automatischen Textgenerierung theoretisch nicht besonders interessant. Spätere Programme verwendeten komplexere Verfahren. Pablo Gervás, nennt in einer Arbeit zur Kreativität automatischer Poeten folgende weitere Verfahren:

Das Generate-and-Test-Verfahren produziert ausgehend von vorliegenden Gedichten und einem vorgegebenen Vokabular nach bestimmten Konstruktionsheuristiken zufällige Wortsequenzen, die dann getestet, verworfen oder akzeptiert werden. Das Verfahren erzeugt - gemessen an einem formal metrischen Standpunkt - makellose Verse, linguistisch sind die Ergebnisse eher dürftig, und auch Sinnhaftigkeit ist nicht notwendigerweise gegeben.

Beim Case-Based-Reasoning-Ansatz wird eine Datenbank von Versen herangezogen, aus denen ausgewählt, die Struktur imitiert und durch optionale Kombination mit Wörtern aus einem Zusatzvokabular erweitert wird. Schließlich wird das Ergebnis durch den Benutzer validiert oder korrigiert und der Datenbank neu hinzugefügt.

Bei Verwendung evolutionärer Algorithmen produzieren Generatormodule eine initiale Population von Gedichten, die in nachfolgenden Generationen verschiedentlich modifiziert werden. Evaluationmsodule selektieren die besten Individuen, die dann für die weitere Modifikation herangezogen werden.

Kreativität: Wildwuchs und Beschränkung

Unabhängig von der Wahl der verwendeten Methode ist ein wesentliches Element stets die Bewertung von Zwischenergebnissen. Dies kann in verschiedener Form erfolgen, sei es die Validation durch den Benutzer im Case-Based-Reasoning-Ansatz, sei es der Testschritt im Generate-and-Test-Verfahren oder die Selektion durch die Evaluationsmodule der evolutionären Algorithmen. Im Extremfall kann auch bei Schablonengenerierung von einer Evaluation gesprochen werden, nur dass hier keine Zwischenergebnisse beurteilt werden, sondern der Benutzer entscheidet, ob ihm das Endergebnis gefällt oder nicht. Die herkuleische Aufgabe, die dem Benutzer zukommt, der mit einer Vielzahl von Gedichten gleichsam überschwemmt wird und nur die einer strengen Prüfung Genüge Leistenden behalten kann, wird vielleicht am deutlichsten von Borges in seiner schönen und zugleich schrecklichen Vision der Bibliothek zu Babel thematisiert, in der die automatische Generierung in ihr Extrem getrieben wird: systematische Erzeugung aller möglichen schriftlichen Werke (und damit auch Gedichte).

Die Herausforderung an den Programmierer besteht daher darin, den Menschen von dieser Aufgabe zu entlasten durch das Schreiben adäquater Bewertungsalgorithmen - ein ähnliches Problem, vor dem Schachprogrammierer stehen, die Spielsituationen automatisch bewerten müssen, nur dass die Aufgabe hier etwas einfacher ist, da es nicht um ästhetische Fragestellungen geht.

Bescheidene Ansprüche?

Von den Kriterien für Gedichte zu den Kriterien für das Erzeugungsprogramm: Welche Anforderungen muss ein Gedicht-Generierungsprogramm erfüllen, um dem wissenschaftlichen Anspruch nach Falsifizierbarkeit zu genügen, ohne den ja jedes x-beliebige Programm, das irgendwelche Wortfolgen erzeugt, als Gedichtgenerator gelten könnte? Dieser Frage musste sich Manurung in seiner Dissertation stellen, und er nennt drei Kriterien: Grammatikalität, Sinnhaftigkeit und Poetizität. Mit Mut zur Lücke und im Bewusstsein dessen, bestimmte moderne Gedichtarten auszuschließen, sind die Begriffe bei ihm wie folgt zu verstehen: Die Texte sollen (cum grano salis) den Regeln der Grammatik entsprechen, es soll ein - wie auch immer gearteter - Sinn vermittelt werden (also keine reinen Zufallstexte) und die erzeugten Gedichte sollen zumindest gewissen Grundregeln von Reim und Strophenform Genüge leisten. Alle drei Kriterien werden von McGonagall, dem Gedichtgenerierungsprogramm Manurungs erfüllt. Skeptiker werden anmerken, dass die Kriterien übervorsichtig formuliert wurden, was nicht ganz von der Hand gewiesen werden kann. Beim derzeitigen Stand der Kunst war dies aber wohl Manurungs einzige Möglichkeit, seine Dissertation erfolgreich abzuschließen, und sie kann sich trotz mancher ästhetischer Mängel der generierten Gedichte sehen lassen: eine höchst interessante und umfangreiche Arbeit von 300 Seiten mit einem zusätzlichen 80-seitigen Anhang. Manurung hatte sich den Anspruch gesetzt, zu zeigen, dass die Verwendung evolutionärer Algorithmen einen innovativen Ansatz zur Erzielung flexibler Textgenerierung darstellt. Das ist ihm gelungen.

Ein Plädoyer zum lockeren Umgang

Die Frage, ob Computer Gedichte schreiben können, wurde schon vorweg beantwortet. Wozu also das Ganze? Ich plädoyiere für einen entspannten Umgang mit computergenerierten Gedichten: Der Laie mag sich an einigermaßen gelungenen Gedichten erfreuen und meinetwegen über missglückte sich amüsieren oder spötteln. Für die Forschung auf dem Gebiet der automatischen Generierung liefert die Gedichterzeugung jedenfalls ein interessantes Experimentierfeld, auf dem Fortschritte erzielt werden können, ohne dass notwendigerweise höchste ästhetische Kriterien erfüllt sein müssen. Außerdem gilt nach wie vor: Beauty is in the eye of the beholder.

Links
Alamo - Atelier de Littérature Assistée par la Mathématique et les Ordinateurs
Arbeiten der Gruppe um Pablo Gervás: http://www.fdi.ucm.es/profesor/pgervas/
Hisar Manurungs Homepage
Materialien zu "Poetry Generation" im Rahmen der Lehrveranstaltung "Buchberger/Trost: Computer und natürliche Sprache", Sommersemester 2006, Inst. f. Med. Kyb. und Artificial Intelligence, MUW Wien

Literaturhinweise
Borges, J.L.: Die Bibliothek zu Babel, in Gesammelte Werke, Bd. 3/I - Erzählungen 1935 - 1944, Hanser, München, 1981.
Borges, J.L.: Das Sandbuch, in Gesammelte Werke, Bd. 4 - Erzählungen 1975 - 1977, Hanser, München, 1982.
Czernin, F.-J., Schmatz F.: Notes about the poetry program POE, 1990. http://www.aec.at/en/archiv_files/ 19901/E1990a_136.pdf
Enzensberger, H.M.: Einladung zu einem Poesie-Automaten, suhrkamp, Frankurt, 2000 (konzipiert 1974).
Gervás, P.: Exploring Quantitative Evaluations of the Creativity of Automatic Poets, in C.Bento, A.Cardoso, G.A.Wiggins (eds.), Proceedings of the ECAI'02 Workshop on Creative Systems: Approaches to Creativity in AI and Cognitive Science, 39-46, Lyon, 2002.
Manurung H.M.: An Evolutionary Approach to Poetry Generation, Ph.D. Dissertation, Univ. Edinburgh, 2003.
Masterman M.: Computerized Haiku, in J.Reichardt.(ed.), Cybernetics, Art and Ideas, Studio Vista, London, 1971, 175-184.
Okopenko, A.: Lexikon einer sentimentalen Reise zum Exporteurtreffen in Druden, Residenz, Salzburg, 1970.
Searle, J.: Minds, Brains and Programs, Behavioral and Brain Sciences 3, 417-424, 1980.
Turing, A.: Computing Machinery and Intelligence, Oxford University Press, 1950.
Valéry, P.: Cahiers (nach einer persönlichen Mitteilung von Franz-Josef Czernin vom 27.20.1992).

Dr. Ernst Buchberger ist Assistenzprofessor am Institut für Med.Kybernetik und Artificial Intelligence des Zentrums für Hirnforschung der Med. Universität Wien und seit 2006 Präsident der Österreichischen Gesellschaft für Artificial Intelligence. Er beschäftigt sich seit über 25 Jahren mit dem Gebiet der automatischen Sprach- und Textverarbeitung, sein Spezialgebiet ist die automatische Generierung von Texten mittels Computer.

 
Anzeige
Schreiben Sie den ersten Kommentar!
    Bitte melden Sie sich an, um zu kommentieren
    • Datum
    • Quelle ZEIT ONLINE
    • Empfehlen E-Mail verschicken | Facebook, Twitter, Buzz …
    • Artikel Drucken Druckversion | PDF
    • Artikel-Tools präsentiert von:

    Service