KI-basierter Curling-Roboter

Künstliche Intelligenz schlägt menschliches Team

26. September 2020

Wissenschaftler der TU Berlin und der Korea University haben einen Curling-Roboter entwickelt, der gegen ein menschliches Team gewinnen konnte. „Curly“ baut auf einer neuartigen KI-Methode auf, die auf die Planung und Handlung in einem datenarmen Entscheidungsumfeld und unter Zeitdruck spezialisiert ist. Die Ergebnisse der Forscher rund um Prof. Dr. Klaus-Robert Müller, Leiter der Arbeitsgruppe Maschinelles Lernen an der TU Berlin und Gastprofessor an der Korea University, wurden jetzt in der renommierten Fachzeitschrift Science Robotics publiziert.

Hochkomplexes Spiel mit vielen Unsicherheiten

Systeme, die auf Künstlicher Intelligenz (KI) beruhen, haben bereits an vielen Stellen Eingang in den Alltag gefunden. In Suchmaschinen, Übersetzungswerkzeugen oder in sozialen Medien haben sie unser Leben vereinfacht. Bei der Automatisierung industrieller Prozesse und bei komplexen Entscheidungsfindungen für selbstfahrende Autos wird KI eine entscheidende Rolle spielen. „Herausfordernd wird die Anwendung der Künstlichen Intelligenz immer dann, wenn sie mit der realen Welt interagieren muss. Anwendungen in der realen Welt sind oft datenarm, voller Unsicherheiten und nicht stationär, also ständigen Veränderungen und einer kontinuierlichen Weiterentwicklung unterworfen. Erste Versuche in der Robotik oder in selbstfahrenden Fahrzeugen sind bereits erfolgreich von anderen Teams weltweit unternommen worden. Die genannten grundlegenden Herausforderungen sind jedoch noch weitgehend ungelöst“, erklärt Klaus-Robert Müller.

„Das Curling-Spiel ist ein hervorragendes Testfeld für Untersuchung der Interaktion zwischen Systemen der Künstlichen Intelligenz und der realen Welt“, bemerkt Prof. Dr. Seong-Whan Lee von der Korea University. Curling ist ein hochkomplexes Spiel, bei dem sich die Umgebungseigenschaften ständig ändern. Jeder Wurf hat Auswirkungen auf den Ausgang des Spiels. Darüber hinaus gibt es aufgrund der strengen Zeitregeln des Spiels keine Zeit zum Umlernen für die KI. „Wir konnten einen Curling-Roboter mit einem Algorithmus ausstatten, der auf einer Kombination von Deep Learning, Reinforcement Learning und zeitlicher Information beruht und damit die vielen Unsicherheiten des Curling-Spiels kompensiert“, so Klaus-Robert Müller. Mit diesem Ansatz ist es den Wissenschaftlern gelungen, die Leistungen von Curly auf ein menschliches Niveau zu heben. Curly meisterte alle oben genannten Herausforderungen und konnte drei von vier offiziellen Spielen gegen menschliche Spitzenteams auf nationaler Ebene gewinnen.

Die olympische Disziplin Curling ist ein hoch strategisches Spiel von kombinatorischer Komplexität. Entscheidend ist die optimale Reaktion auf die oft unvorhergesehenen Züge des Gegners. Zudem wird Curling auf einer rutschigen Oberfläche, einer Eisschicht, gespielt. „Sowohl die Robotersteuerung für das Spielen eines Steins als auch die Simulation der Stein-Bewegung müssen ständig neu kalibriert werden, um nichtlineare Reibungseffekte und Unsicherheiten, die durch die rutschige Eisfläche entstehen, effektiv zu kompensieren. Dazu kommen heterogene Eisverhältnisse und die Unmöglichkeit, diese im Detail zu bewerten. „Alle strategischen Entscheidungen, Planungen, Schätzungen bei der Synchronisierung zwischen KI-Agenten und Robotersteuerung müssen nicht nur innerhalb von Echtzeit, sondern auch unter hohen Unsicherheiten durchgeführt werden. Dabei sind die Daten, die zur Verfügung stehen, um das Deep Learning-Netzwerk zu trainieren, sehr begrenzt. Insgesamt eine gewaltige Herausforderung für die moderne KI“, erklärt Klaus-Robert Müller.

Forschungsbericht unter: www.robotics.sciencemag.org/content/5/46/eabb9764

Bildquelle: TU Berlin