Basislager

Gehen Sie erst los, wenn Sie die folgenden Grundlagen in Ihren Rucksack gepackt haben

Ein Computer, so heißt es oft, kann nicht mehr als der Programmierer, der ihm die Anweisungen gegeben hat. Er tut nur das, was man ihm befohlen hat. Das stimmt zwar, wenn man die unterste Maschinenebene betrachtet: Die Software arbeitet Zeile für Zeile die Befehle ab, die der Programmierer aufgeschrieben hat. Aber heißt das, dass ein Computer nichts lernen kann? Dieser Schluss ist ebenso falsch wie der, dass ein Schüler niemals klüger sein kann als sein Lehrer. So wie ein guter Lehrer seinen Schülern nicht nur Fakten eintrichtert, sondern ihnen zeigt, wie sie sich weiterentwickeln können – so kann auch ein Computer derart programmiert werden, dass er eine Aufgabe immer besser erfüllt, je öfter er sie angeht. Willkommen in der Disziplin des Maschinellen Lernens.

Das erste selbstlernende Programm, das Furore machte, entwickelte der IBM-Forscher Arthur Samuel 1956. Die Software spielte Dame auf achtbarem Amateurniveau. Am Anfang kannte der Computer nur die Regeln des Spiels sowie ein paar Faustregeln, die ihm Samuel mitgegeben hatte. Mit jedem Spiel aber lernte die Maschine dazu. Nach acht bis zehn Stunden Trainigszeit war sie besser als ihr Schöpfer. Im Damespiel haben Menschen heute gegen Computer keine Chance mehr. Im Schach ist uns der Rechner zumindest ebenbürtig, und seit Googles Programm AlphaGo den Europameister im Go schlug, ist der Mensch in keinem Brettspiel mehr unbesiegbar.

Maschinelles Lernen ist ein Teilgebiet der Künstlichen Intelligenz. Heute fällt eine Vielzahl von Softwaretechniken unter diesen Begriff: Computer lernen, Menschen auf Fotos zu identifizieren. Sie steuern fahrerlose Autos durch den Stadtverkehr, nachdem sie einige Tausend Stunden trainiert haben. Sie finden Muster in riesigen Datensätzen (Big Data).

Bei vielen dieser Lerntechniken ist der Mensch noch immer der Lehrer: Er gibt ein Ziel vor und bewertet die Leistungen des Computers, der daraufhin sein Verhalten variiert und anpasst, um immer bessere Noten zu bekommen. Inzwischen gibt es aber auch das sogenannte unbeaufsichtigte Lernen: Der Computer muss sich auf einen Haufen von Daten selbst einen Reim machen. So fütterte Google ein Computernetz mit Millionen von Fotos, und das Programm bildete selbsttätig Kategorien wie "Katze" oder "Mensch". Das ähnelt schon sehr dem Lernen eines Kleinkinds, das ebenfalls Kategorien bildet, bevor es sie benennen kann.

Erster Anstieg

Los geht’s! Auf leichten Anhöhen begegnen Sie Erkenntnissen, die Sie ins Schwitzen bringen können.

Dieser Text stammt aus dem ZEIT WISSEN Magazin 5/16.

Als erste Kletterübung wollen wir uns mit einem Spiel beschäftigen, das eigentlich schon für Fünfjährige zu simpel ist: Tic-Tac-Toe. Das Spielfeld bilden dreimal drei Kästchen. Zwei Spieler setzen abwechselnd ihre Spielsteine. Wem es gelingt, drei seiner Steine in eine waagerechte, senkrechte oder diagonale Reihe zu setzen, der hat gewonnen. Es gibt 255.169 verschiedene mögliche Verläufe des Spiels. In 131.185 gewinnt der erste Spieler, in 77.904 der zweite. 46.080 Varianten enden unentschieden. Wichtiger als diese Zahlen ist die Information, dass ein "kluger" Spieler kein Spiel verlieren wird: Egal ob er als Erster oder Zweiter spielt, er kann seine Steine (oder Kreuze beziehungsweise Kreise, wenn man mit Stift und Papier spielt) so setzen, dass das Spiel zumindest unentschieden ausgeht.

Wie findet man in einer gegebenen Situation den besten Zug? Bei Tic-Tac-Toe lassen sich alle möglichen Züge im Voraus berechnen. Das führt zu einem Entscheidungsbaum: Man betrachtet alle Züge, die man selbst in der momentanen Stellung machen könnte, dann jeweils alle möglichen Antwortzüge des Gegners und so weiter. Bei Schach führt das zu einer Explosion der Zahl möglicher Konfigurationen, bei Tic-Tac-Toe bleibt die Sache übersichtlich – spätestens nach neun Zügen ist das Spielfeld besetzt und weist eine von 138 möglichen Endpositionen auf. Jeder Ast endet mit dem Sieg eines Spielers oder einem Remis.

Um jeder möglichen Spielposition einen Wert zuzuordnen, bewertet man jedes Blatt an diesem Baum: Ein eigener Sieg bekommt den Wert +1, eine Niederlage den Wert –1 und ein Remis den Wert 0. Es folgt ein Schritt zurück im Spiel. Bei jeder Astgabel des Entscheidungsbaums bekommt eine Spielstellung wiederum einen Wert, und zwar den höchsten der nachfolgenden Werte, wenn man selbst am Zug ist, und den niedrigsten der nachfolgenden Werte, wenn der Gegner dran ist. Am Ende haben alle Stellungen die Bewertung 1, 0 oder minus 1. Auf den Ästen mit einer 1 handelt es sich um eine Strategie, mit der man nur gewinnen kann.