Computer
Berechnet bluffen
In Las Vegas pokern Roboter um Dollar. Wer von ihnen ist der weltbeste chipgesteuerte Zocker? Forscher hoffen auf Erkenntnisse über das Wesen künstlicher Intelligenz.
Hunderttausend Dollar liegen auf dem Tisch, doch kein Teilnehmer der Pokerpartie hat Hände, um sie zu ergreifen. Die Akteure können auch keine Augenbraue heben, keinen Mundwinkel verziehen – ein Turnier ohne ein einziges Pokerface. Denn nicht Menschen, sondern Programme pokern. Seit dem 12. Juli zocken sie um die sechsstellige Siegprämie der World Series of Poker Robots (WSOPR).
Setzen, bluffen, mitgehen, erhöhen: Maschinen lernen das menschlichste aller Spiele. Die Schauveranstaltung in Las Vegas versetzt nicht nur die Pokerfans in Aufruhr. Die Informatiker hoffen auf Erkenntnisse bei der Erforschung künstlicher Intelligenz.
Poker gilt als das »psychologischste« unter den Glücksspielen, ein Nervenkrieg um die Einschätzung des Gegners. Jahrelange Spielpraxis und gute Beobachtungsgabe machen den Profi aus. Das jedenfalls galt bis zum Mai 2003. Da staubte ein unbekannter 27-jähriger US-Amerikaner unter dem bezeichnenden Namen Chris Moneymaker mit einem Full House die Siegprämie der Meisterschaft World Series of Poker (WSOP) ab – zweieinhalb Millionen Dollar. Trainiert hatte er nur im Internet, auf den Web-Seiten von Online-Casinos, wo Glücksspiele anonym und ohne persönliche Anwesenheit möglich sind. Doch dieses Trainingslager nutzen nicht nur menschliche Zocker.
Um im www-Casino systematisch Geld zu verdienen, tüfteln Bastler und Mathefreaks an Pokerrobotern, kurz Pokerbots – eine Software, die per Internet ein Onlinespiel genauso bedienen kann, als ob ein Mensch spielen würde.
Das Phänomen ist inzwischen so weit verbreitet, dass Glücksspielbetreiber zur Gegenwehr greifen. PartyPoker, eine Firma aus Gibraltar, beschäftigt nach eigenen Angaben eine hundertköpfige Mannschaft von Überwachern in ihrem Online-Casino, die nach Bots Ausschau halten. Algorithmen bluffen zu lassen ist mittlerweile fast überall verboten. Doch es ist ein offenes Geheimnis, dass an vielen virtuellen Spieltischen Pokerprogramme mitmischen.
»Wie programmiert man Intuition? Ich habe keine Ahnung«
Wie erfolgreich die Pokerbots sind, ist höchst umstritten. »Lange Zeit sind alle Programmierer am Poker gescheitert«, sagt Jonathan Schaeffer von der Universität von Alberta im kanadischen Edmonton. Schaeffer, Informatiker und Leiter eines 32-köpfigen Teams namens Games Group, ist der führende Experte für Computerpoker. Früher hat er Schach- und Dame-Bots entwickelt. Er vergleicht die Forschung an Pokerbots mit dem Triumph des Schachprogramms Deep Blue über den ehemaligen Schachweltmeister Garri Kasparow 1997: »Als es das Verfahren gab, um alle möglichen Spielzüge auszurechnen, mussten wir nur auf einen Computer warten, der schnell genug war. Das ist beim Poker ganz anders.« Verlangte das Spiel der Könige nach einem Supercomputer, laufen Pokerbots auf ordinären Büro-PCs.
In einer Zweispielerpartie der im Internet populären Pokervariante Texas hold’em ergeben sich eine Milliarde mal eine Milliarde denkbare Situationen. Schaeffers Programm kann ähnliche Spielsituationen zusammenfassen, sodass es nur zehn Millionen Möglichkeiten abwägen muss. Doch das ist nicht die eigentliche Herausforderung. »Poker ist ein Spiel, bei dem in jeder Spielsituation Informationen fehlen«, sagt Schaeffer. Mehr als sein eigenes Blatt (zwei Karten zu Beginn, am Ende fünf) und die fünf Karten, die aufgedeckt auf dem Tisch liegen, sieht ein Pokerspieler nicht.
Der Schlüssel liegt daher mehr im Raten als im Rechnen: Welche Karten hat der Gegner, welche verbergen sich im Stapel? Aussteigen, tauschen, das Gebot erhöhen – diese Entscheidung treffen Menschen intuitiv. »Könnte ich Intuition in meinen Rechner stecken, hätte ich den stärksten Pokerbot der Welt«, sagt Schaeffer, »aber wie programmiert man Intuition? Ich habe keine Ahnung!«
Solange dies nicht gelingt, sind die Forscher auf eine Doppelstrategie aus Rechnen und Täuschen angewiesen: Beim Rechnen hat der Computer einen Vorteil. Er weiß, dass ein Royal Flush (Pik-Zehn, Bube, Dame, König, As derselben Farbe) mit einer Wahrscheinlichkeit von 1:649740 aus einem Deck Spielkarten gezogen wird. Ein Full House (drei Karten einer Sorte plus ein Paar) kommt im Mittel alle 586-mal vor, ein schlichtes Paar jedes zweite Mal. Doch das Wissen um die Wahrscheinlichkeit, dass der Gegner ein besseres Blatt hat, ist nur ein geringer Faktor für die Entscheidung, den Einsatz zu erhöhen, die Karten der Gegner sehen zu wollen oder lieber zu passen.
»Das reicht nicht unbedingt aus, um ein Pokerturnier zu gewinnen«, sagt der Informatiker Johannes Fürnkranz von der Knowledge Engineering Group der TU Darmstadt. Denn auch wer die optimale Spielstrategie errechne, könne nur gewiss sein, in der Spielsituation nicht schlechter zu spielen, als es mathematischer Durchschnitt wäre. Um seinen Gewinn zu maximieren, muss der Spieler sich an die Gegner anpassen. Poker wird besonders vom spielerspezifischen Verhalten beeinflusst. »Hier ist es so, dass Spieler bewusst von der theoretisch richtigen Aktion abweichen, um ihre Gegner zu bluffen. Das ist notwendig für den Erfolg.«
In der Täuschung liegt also der Schlüssel zum Sieg. Wesentlich für einen guten Pokerspieler – da sind sich Informatiker und Zocker einig – ist die Fähigkeit zu bluffen, ohne sich dabei etwas anmerken zu lassen (Pokerface), und das Einschätzungsvermögen dafür, ob der Gegner blufft.
»Selbst zu bluffen ist für den Computer einfach«, sagt Jonathan Schaeffer. WSOPR-Teilnehmer Brian Edwards beschreibt, wie sein Roboter blufft: »Der Bot muss verstehen, welche Karten er bei sich erwarten würde, wenn er jemand anders wäre. Aus diesen Möglichkeiten muss er eine auswählen, die nicht seinen tatsächlichen Karten entspricht.« Dann versucht die Software durch Bieten, Ziehen und Zögern, den Eindruck dieser ausgedachten Kartenhand zu erwecken.
»Die große Herausforderung ist, sich ein Bild vom Gegner zu machen«, sagt Schaeffer. Die Informatiker sprechen vom opponent modelling, laut Fürnkranz eine »sehr große wissenschaftliche Herausforderung«. In dieser Modellierung fließt alles zusammen, was Spiele für die Erforschung künstlicher Intelligenz so reizvoll macht: Es gilt, ein Handeln einzuschätzen, das nur teilweise von Regeln beschrieben werden kann – und das in einer Situation, die nur teilweise zu überblicken ist. »Die Akteure handeln vielleicht irrational«, erklärt Schaeffer, »es gibt Glück, also ein Zufallselement. Wie im echten Leben.«
Soll heißen: Man kann Know-how vom Pokerbot auf andere Anwendungen übertragen. So sollen Computer zukünftig bei Entscheidungen helfen, in denen Ja-Nein-Logik mangels Daten versagte: Wie soll eine Geschäftsstrategie angesichts schwer einzuschätzender Konkurrenten aussehen? Welche Lücken weist das Verhandlungsverhalten eines unbekannten Gegenübers auf? Ein passender Algorithmus muss einen Mix aus Mathematik, Psychologie und Bauchgefühl leisten. »Wir erzeugen vielleicht keine Intelligenz hier, aber wenigstens bauen wir Computer, die sich intelligent zeigen«, sagt Schaeffer.
»Der Computer bekommt einfach keine Angst«, sagte der kanadische Top-Pokerspieler Gautam Rao dem Wissenschaftsmagazin New Scientist, nachdem er gegen einen Prototypen aus Schaeffers Werkstatt angetreten war. Er lief mit seiner sonst sehr erfolgreichen aggressiven Spieltaktik gegen den Pokerbot einfach auf. Erst als er seine Taktik änderte, war er in der Lage, dem Programm wieder Dollar abzunehmen. Was war geschehen? Schaeffers Rechner ist ein fleißiger Beobachter. Er vermerkt jedes Detail über den Gegner: welche Karten er zieht und abgibt, was sich im Nachhinein als Bluff herausstellt und wann er lieber aussteigt. Binnen weniger Spielzüge erstellt die Software so ein Profil des Gegenübers, in dem auch subtile Taktikdetails sichtbar werden. In Ermangelung eines menschlichen Gespürs ersetzt der Pokerbot Intuition durch Interpretation. Dem Rechner reicht die Essenz des gegnerischen Handelns. Und wenn die Maschine geschickt reagiert, entsteht bei Menschen der Eindruck sinnhaften Tuns.
Der Wissenschaftler am Pokertisch ist ein Exot unter lauter Geheimniskrämern
Algorithmen, die das zustande bringen, gelten als Schlüsselelement für bessere Benutzerschnittstellen künftiger Elektrogeräte und Computerprogramme. Digitalspiele verwenden heute schon Künstliche Intelligenzen (KIs), die dem Spieler das Gefühl geben, es mit einem menschlichen Gegenüber zu tun zu haben. Schaeffers Institut kooperiert mit Electronic Arts aus Kanada, dem weltgrößten Computer- und Videospieleverlag.
Ausgerechnet vom Turnier der Bots in Las Vegas aber sollte Schaeffers Algorithmus ausgeschlossen werden. »Ich weiß nicht einmal, weshalb«, sagte er Ende Juni. Mittlerweile steht ein Kompromiss: Schaeffer und sein Team werden ein Schauturnier gegen den Gewinner des regulären Wettbewerbs spielen. »Es wäre unfair gewesen, wenn wir als Team um das Geld gespielt hätten, während die anderen Teilnehmer – angeblich – Einzelne sind«, sagt der Professor zur Begründung.
In der Tat ist Schaeffer als Wissenschaftler am Pokertisch in Las Vegas ein Exot zwischen lauter Geheimniskrämern. Sechs Teilnehmer aus Hong Kong, Kanada, Spanien und den USA waren bei Redaktionsschluss gesetzt. Anders als die Gruppe aus Edmonton veröffentlicht keiner dieser Hobby-Bastler – darunter Informatiker, aber auch ein Autohändler und ein Landwirt – seine Ergebnisse. »Das sind Leute, die Programme schreiben, um damit online zu spielen; sie geben sich für menschliche Spieler aus und wollen Kasse machen«, sagt Schaeffer. »Niemals würden die etwas preisgeben.«
- Datum 21.11.2006 - 03:54 Uhr
- Quelle (c) DIE ZEIT 14.07.2005 Nr.29
- Empfehlen E-Mail verschicken | Bookmarks
- Artikel Drucken Druckversion | PDF
-
Artikel-Tools präsentiert von:






