In de toekomst zijn een soldaat en een gamecontroller alles wat nodig is om robots te leren hoe ze mensen kunnen overtreffen, zegt het Army Research Laboratory van het US Army Combat Capabilities Development Command. Samen met de Universiteit van Texas in Austin hebben de onderzoekers een algoritme ontworpen waarmee een autonoom grondvoertuig zijn bestaande navigatiesystemen kan verbeteren door naar een menselijke bestuurder te kijken.
Deze zogenaamde adaptieve plannerparameters die leren van demonstratie, of APPLD zijn met succes getest op een van de experimentele autonome grondvoertuigen van het leger. “Door benaderingen als APPLD te gebruiken, zullen de huidige soldaten in bestaande trainingsfaciliteiten kunnen bijdragen aan verbeteringen in autonome systemen door simpelweg hun voertuigen normaal te laten werken”, zei legeronderzoeker Dr. Garrett Warnell.
Autonoom navigeren
“Technieken zoals deze zullen een belangrijke bijdrage leveren aan de plannen van het leger om gevechtsvoertuigen van de volgende generatie te ontwerpen en in gebruik te nemen die zijn uitgerust om autonoom te navigeren in offroad-omgevingen.”
Voorbeeld
De onderzoekers combineerden machine learning van demonstratie-algoritmen en meer klassieke autonome navigatiesystemen. In plaats van een klassiek systeem helemaal te vervangen, leert APPLD hoe het bestaande systeem kan worden afgestemd om zich meer als het menselijke voorbeeld te gedragen. Dit zorgt ervoor dat het gebruikte systeem alle voordelen van klassieke navigatiesystemen behoudt terwijl het ook flexibel en aanpasbaar is aan nieuwe omgevingen, zei Warnell.
Xbox
“Eén enkele demonstratie van menselijk rijden, met behulp van een standaard Xbox draadloze controller, stelde APPLD in staat om te leren hoe het bestaande autonome navigatiesysteem van de auto op een andere manier kan worden afgestemd, afhankelijk van de specifieke lokale omgeving”, aldus Warnell. “In een krappe gang vertraagde de menselijke bestuurder bijvoorbeeld en reed voorzichtig. Na het observeren van dit gedrag, leerde het autonome systeem ook zijn maximumsnelheid te verlagen. Hierdoor kon het voertuig uiteindelijk met succes autonoom navigeren in andere nauwe gangen waar het eerder had gefaald. ”
Minder fouten
Uit de experimenten van het team bleek dat het APPLD-systeem na training sneller en met minder fouten door de testomgevingen kon navigeren dan met het klassieke systeem. Bovendien navigeerde het getrainde APPLD-systeem vaak sneller door de omgeving dan de mens die het heeft getraind.
Opleiding
“De huidige autonome navigatiesystemen moeten normaal gesproken de hand opnieuw worden afgesteld voor elke nieuwe implementatieomgeving”, zei legeronderzoeker dr. Jonathan Fink. “Dit proces is buitengewoon moeilijk – het moet worden gedaan door iemand met een uitgebreide opleiding in robotica, en het vereist veel vallen en opstaan totdat de juiste systeeminstellingen kunnen worden gevonden. APPLD leert automatisch door naar een mens te kijken.”