Künstliche Intelligenz : Das Erbgut der Roboter

Maschinen das Lernen beibringen – wer das schafft, hat den Schlüssel zu künstlicher Intelligenz gefunden.

von
Intelligenzbestie. Bislang tun Maschinen nur das, was ihnen Menschen zuvor ins Programm geschrieben haben. Roboter wie der humanoide „ iCub“ jedoch sind so konstruiert, dass sie selbstständig lernen – zum Beispiel einen Ball zu greifen.
Intelligenzbestie. Bislang tun Maschinen nur das, was ihnen Menschen zuvor ins Programm geschrieben haben. Roboter wie der...Foto: Philippe Desmazes/AFP

Der erste Versuch geht noch daneben. Etwas ungelenk holt der dicke, graue Roboterarm Schwung. In seiner Hand hält er einen Becher, an der Unterseite an einer Schnur ein roter Ball. Doch anstatt im Becher zu landen, baumelt die Kugel nur langsam hin und her. Nach 40 Versuchen schafft es der Roboter zum ersten Mal, den Ball in den Becher zu manövrieren. Und nach 50 weiteren beherrscht er die Technik vollkommen – es gelingt ihm jedes Mal. „Ein erwachsener Mensch würde es schon nach drei oder vier Versuchen hinbekommen, aber er wäre nie perfekt“, sagt Jan Peters, der an der TU Darmstadt Professor für intelligente autonome Systeme ist. In seinem Labor übt der Roboter das Spiel „Ball an der Schnur“ und auch, gegen eine Ballmaschine Tischtennis zu spielen.

Roboter lernen das Lernen

Anstatt dem Roboter beim Üben zuzuschauen, könnte Peters natürlich auch versuchen, den Armschwung zu programmieren, sodass der Ball sofort im Becher landet. Aber das will er gar nicht. Der Roboter soll es selbst lernen. Peters will herausfinden, wie man einer Maschine beibringt, sich um die Lösung einer neuen Aufgabe zu bemühen und dabei flexibel auf neue Situationen zu reagieren. Er will wissen: Wie können Maschinen lernen, selbstständig zu lernen?

Auf dem Weg zu einer künstlichen Intelligenz (KI), die dem Menschen ähnlich ist, ist das eine der wichtigsten Fragen. Noch sind wir weit davon entfernt. Programme wie Apples Siri oder Microsofts Cortana können zwar auf Unmengen an Daten zugreifen und diese verarbeiten. Sie können aber nur die Aufgaben erfüllen, für die sie programmiert wurden.

Deep Blue konnte nur Schach spielen, sonst nichts

„IBMs legendärer Computer Deep Blue war zwar perfekt darin, Schach zu spielen. Aber nutzlos für ein viel simpleres Spiel wie ,Schere, Stein, Papier’“, sagt Demis Hassabis, Mitgründer des von Google erworbenen Unternehmens DeepMind, das auf künstliche Intelligenz spezialisiert ist. Auch Roboter, wie sie heute in Fabriken stehen, sind hoch spezialisiert. Für jede Situation, die womöglich auftritt, muss ein Programm geschrieben werden. „Mittlerweile ist die Programmierarbeit das Teuerste am ganzen Roboter“, sagt Peters.

Aber wie geht es besser? Vereinfacht könnte man sagen: Die Roboter und Computer müssen mehr Arbeit selbst machen. Jan Peters versucht deshalb, Algorithmen zu entwickeln, die dem Roboter als Lernregeln dienen sollen, wenn er sich etwas Neues aneignet. Den Lernprozess hat er in mehrere Schritte aufgeteilt.

Perfektionierung per Belohnung

Bei dem Spiel mit dem Becher und dem Ball führt zunächst eine Mitarbeiterin den Arm des Roboters, um ihm ungefähr zu zeigen, wie es richtig geht. „Damit schränkt man die Zahl der möglichen Bewegungen stark ein“, sagt Peters. Der Roboter soll die Bewegung dann nachahmen. Dieses Imitationslernen beherrschen Babys schon kurz nach der Geburt.

Anschließend verbessert sich der Roboter immer weiter, indem er die Bewegung leicht verändert. Führt eine Veränderung zum Erfolg, erhöht er ihre Häufigkeit. „Reinforcement learning“ heißt dieses System – es ist inspiriert von der Dopaminausschüttung im Belohnungssystem des Gehirns. Hat der Roboter irgendwann die richtige Bewegung gefunden, speichert er diese als Schablone ab. Er kann sie später abrufen, weiterentwickeln und bei Bedarf auch an neue Situationen anpassen.

„Wir müssen nur diese Lernprozesse programmieren, nicht aber das Verhalten selbst. Wir müssen noch nicht einmal die Situation verstehen, in der sich der Roboter befindet“, erklärt Peters. Egal ob der Roboter Tischtennis spielt oder Pflanzen gießt – der Wissenschaftler möchte erreichen, dass stets die gleichen Lernalgorithmen zum Einsatz kommen.

4 Kommentare

Neuester Kommentar
      Kommentar schreiben