Dass sich die Pokerwelt womöglich drastisch ändert, stand dort, wo es vielleicht nicht jeder vermutet hatte. Noam Brown und Tumas Sandholm veröffentlichten Anfang Juli im Fachjournal Science einen Artikel. Ihr Roboter, so schrieben sie, hat gegen die besten Pokerspieler der Menschen gewonnen. Pluribus heißt die künstliche Intelligenz (KI), ein Bot, und er benötigt im Gegensatz zu vielen seiner Artgenossen nur wenig Arbeitsspeicher: 128 Gigabyte. Die beiden Forscher schrieben von einem "Meilenstein".

Vor allem die Pokerszene versetzte Pluribus in Aufregung. Denn der Bot hatte gegen 13 der besten Spieler der Welt dauerhaft gewonnen, unter ihnen auch der Schweizer Linus Löliger, der vielleicht beste Onlinespieler der Welt. 10.000 Hände wurden in zwölf Tagen gespielt. In einer zweiten Versuchsanordnung, in der ein Profi gegen fünf Bots antrat, war die KI auch besser. Am Ende hatte sie das 480-fache ihres Einsatzes wieder. "Wenn es echtes Geld gewesen wäre, hätte Pluribus etwa 1.000 Dollar pro Stunde verdient", sagt einer seiner Schöpfer.

KI und der Sport

Poker ist der nächste Sport, in dem eine KI beachtliche Erfolge erzielt und den Menschen besiegt hat. Im Schach gelang es mit Deep Blue. Auch der beste Go-Spieler wurde sensationell und viel früher als erwartet von einem Google-Computer besiegt. Nun also Poker, ein Spiel, von dem viele immer noch meinen, er basiere vor allem auf einer glücklichen Fügung oder dem richtigen Bein beim Aufstehen. Doch der Erfolg von Pluribus hatte sich angedeutet, die beiden Forscher der Carnegie Mellon University hatten schon andere erfolgreiche Pokerbots programmiert. Und sie versprechen der Forschung (und der Pokerszene) einen großen Nutzen von ihrer Entdeckung.

Bisher beschränkten sich die Erfolge von KIs im Poker auf das Heads-Up, dem Duell zweier Spieler. Neu an Pluribus ist, dass die KI sich gegen mehrere Spieler behauptet. Die größte Hürde war: Im Gegensatz zum Schach sind beim Poker nicht alle Informationen bekannt, das Blatt der Gegner etwa und die im Laufe einer Runde neu dazukommenden Karten bei der beliebtesten Variante, dem Texas Hold'em. Das macht es einer KI unmöglich, alle Varianten durchzurechnen.

Das versuchten die Forscher mit Pluribus erst gar nicht. Stattdessen gelang es ihnen, der KI ein vermeintlich menschliches Verhalten beizubringen: Der Bot blufft. "Er ist ein Monsterbluffer", sagte Jason Les, einer der Pokerprofis, der gegen ihn antrat. Kristian Kersting, KI-Forscher an der TU Darmstadt, sagt: "Am spannendsten ist es doch, dass Pluribus zeigt: Menschliche Züge, wie etwa ein Bluff, die wir als Intuition beschreiben, können algorithmisch abgebildet werden. Wir lernen mehr über uns als über die KI."

Die Forscher ließen ihre KI acht Tage lang offline gegen sich selbst spielen. Da lernte sie offenbar, dass sich bluffen lohnt. Zu Beginn verhielt sich der Computer wie ein Anfänger, doch er häufte im Trial-and-Error-Verfahren immer mehr Wissen an. So entstand sein Datenschatz, der mit jedem Spiel weiterwächst. "Blaupause" nennen die Forscher Pluribus' Strategiegerüst, das mit erstaunlich wenig Rechenaufwand zustande kam.

Auf diese "Blaupause" greift Pluribus dann immer wieder zurück und sucht nach Lösungen. Und wurde damit zum undurchschaubaren Gegner. "Es war ziemlich hart, weil man kein Muster erkannte", sagt Darren Elias, der gegen fünf Bots gleichzeitig antrat. Mal spielte Pluribus die gleiche Hand so, mal so, und setzte zum Bluffen viel höhere Beträge ein, als Menschen es tun würden. "Die Strategie unterscheidet sich stark von der von Menschen, weil Pluribus auch nie gelernt hat, wie ein Mensch zu spielen", sagt Erfinder Brown.