7103793-1995_22_06.jpg

Ein Computer ist klüger als sein Erfinder

19451960198020002020

Verwirrung in einem IBM-Labor in den USA: Ein Computerwissenschaftler entwickelte ein Backgammon-Programm, das intelligenter ist, als es laut Theorie eigentlich sein dürfte.

19451960198020002020

Verwirrung in einem IBM-Labor in den USA: Ein Computerwissenschaftler entwickelte ein Backgammon-Programm, das intelligenter ist, als es laut Theorie eigentlich sein dürfte.

Werbung
Werbung
Werbung

Die künstliche Intelligenz „lernt lernen”: Der Computerwissenschaftler Gerald Tesauro vom IBM-Labor Yorktown Heights (New York) entwickelte ein fähiges Backgammon-Programm. Durch ein neuronales Netzwerk ahmt das Programm die Funktionsweise des Gehirns nach. Bei den ersten Spielen noch ein blutiger Anfänger, bringt „TD-Gammon” sich selbst nach und nach das Können eines Meisters bei. Wie die Maschine das eigentlich schafft, gibt den Wissenschaftlern noch Bätsei auf. Von ihrer Erforschung erhofft man jedoch wertvolle Erkenntnisse nicht nur über die künstliche, sondern auch über die menschliche Intelligenz.

Lernfähige Spielprogramme, die mit jedem Match besser werden, gibt es schon länger. Aber erst TD-Gammon kommt, so Tesauro, völlig ohne strategische Anleitung durch den Menschen aus. Die Software erhält nur die allernötigsten Vorgaben: die Anordnung der Felder auf dem Brett, die Aufstellung der zweimal 15 Steine, die Regeln. Damit muß TD-Gammon auskommen. Strategisches Geschick erwirbt das Programm erst im Spiel gegen sich selbst.

Wenn die elektronischen Würfel „fallen”, berechnet TD-Gammon für jeden mögliehen Zug die Wahrscheinlichkeit eines Sieges. Die Berechnungen verwenden dafür „Gewichtungen”, gespeicherte Werte für jede Stellung. Der Zug, der bei diesen Schätzungen am besten abschneidet, wird ausgeführt. Ist die Partie geschlagen, folgt der „Lernschritt”: Die Gewichtungen werden so nachjustiert, daß sie dem tatsächlichen Ausgang besser entsprechen. Bei Siegen steigen, bei Niederlagen sinken die entsprechenden Gewichtungen.

Anders als ein menschlicher Back-gammon-Neuling zieht die Software im Anfängerstadium eher zufällig. Die ersten Runden dauern lange. Dann, nach rund 100 Partien, „rastet irgendwas ein”, wie Tesauro meint, und das Tempo steigt spürbar. Von Mal zu Mal steigert TD-Gammon sein Können.

Programm schließlich besser, als das laut Theorie eigentlich möglich ist. Beim letzten Weltcup-Turnier bewährte sich der Backgammon-Com-puter sogar gegen Weltklassegegner. Von 38 Spielen gingen 19 an die Maschine, 19 mal blieben die Menschen Sieger. Wieso TD-Gammon dieses Niveau erreicht, ist noch ein Bätsei.

TD-Gammon funktioniert mit einem neuronalen Netzwerk, einer Software, die das Gehirn nachahmt, indem sie die Nervenzellen, ihre Vernetzung und deren Knotenpunkte, die Synapsen, simuliert. Die Daten werden daher nicht wie in einem herkömmlichen Betriebssystem verarbeitet, sondern wie in einem Netzwerk Tausender und Abertausender winziger Miniatur-Computer.

Die Hardware ist keine Spezialanfertigung, sondern eine normale IBM-Workstation vom Typ RISC System/6000, wie sie in Technik und Industrie für rechenintensive Aufgaben benützt wird. Durch die Schnelligkeit der Workstation schafft TD-Gammon in einem Monat Rechenzeit 300.000 Partien - dreimal soviel wie ein Backgammon-Profi in seinem gesamten Leben. Diesen Trainingsvorsprung benötigt TD-Gammon freilich dringend, denn sein „Gehirn” besitzt nur 25.000 Synapsen, nicht mehr als eine Meeresschnecke.

Der mathematische Befehl für das „Lernen”, der Algorithmus, ist im Grunde einfach und stammt vom Computerwissenschaftler Richard Sutton, GTE-Laboratorien, Massachusetts. Da das Gelernte wie eine Belohnung erst am Ende eines Spiels abgespeichert wird, spricht man von einem Zeit-Differenz-Algorithmus, und davon hat das Programm auch seinen Namen: temporal difference -TD-Gammon.

Im IBM-Labor erwartet man von den Forschungen auch Fortschritte bei der Lenkung von Roboterhänden oder bei der Prognose von Börsentrends, kurz bei Steuerungsaufgaben aller Art (siehe FURCHE 21/1995). Ungeklärt bleibt jedoch das Kuriosum, wieso TD-Gammon besser spielt als die herrschende Theorie über lern-fähige Maschinen derzeit erklären kann. Gelingt es, dieses Rätsel zu lösen, wird man besser verstehen, auf welche Art und Weise Maschinen -und Menschen - lernen.

Ein Thema. Viele Standpunkte. Im FURCHE-Navigator weiterlesen.

FURCHE-Navigator Vorschau
Werbung
Werbung
Werbung