Google heeft recentelijk de mogelijkheden van zijn nieuwe robotmodel, RT-2, gedemonstreerd. Deze robot met één arm is uitgerust met probleemoplossende vaardigheden, mogelijk gemaakt door baanbrekende kunstmatige intelligentie (AI) technologie.
Tot voor kort hadden robots moeite met het omgaan met onbekende objecten en misten ze het vermogen om logische conclusies te trekken. De RT-2 heeft echter deze beperkingen overwonnen, zoals onlangs is aangetoond in een demonstratie waarbij de robot de instructie “Pak het uitgestorven dier” kreeg. Tussen een set plastic figuurtjes identificeerde en pakte de robot succesvol een dinosaurus op.
Deze doorbraak is het resultaat van Google’s integratie van zijn robots met taalmodellen, hetzelfde soort AI-systeem dat bekende chatbots als ChatGPT en Bard aandrijft. Deze integratie met AI heeft geleid tot slimmere robots met een verhoogd begrip en vermogen om problemen op te lossen.
Het recent onthulde RT-2 model markeert een stap in de richting van een aanzienlijke transformatie in de constructie en programmering van robots. Deze verandering heeft geleid tot een heroverweging van Google’s volledige onderzoeksprogramma. Vincent Vanhoucke, hoofd van de robotica bij Google DeepMind, stelde dat veel van hun eerdere werk “volledig ongeldig” is geworden.
Hoewel robots nog steeds niet over de handigheid van mensen beschikken, vertegenwoordigt Google’s toepassing van AI-taalmodellen om robots uit te rusten met nieuwe vaardigheden voor redeneren en improvisatie een beloftevolle vooruitgang in de robotica. Ken Goldberg, een professor in robotica aan de Universiteit van Californië in Berkeley, prees deze ontwikkeling en stelde: “Wat zeer indrukwekkend is, is hoe het semantiek met robots verbindt.”
In het verleden werden robots geprogrammeerd met een specifieke set instructies om mechanische taken uit te voeren, maar deze aanpak was traag en arbeidsintensief. Er ontstond echter het concept van het gebruik van AI-taalmodellen die zijn getraind op grote delen van internettekst om nieuwe vaardigheden te leren. Google-onderzoekswetenschapper Karol Hausman meldde dat ze ongeveer twee jaar geleden begonnen zijn met “het verbinden van deze modellen met robots”.
Het nieuwste robotmodel van Google, RT-2, wordt aangeduid als een “visie-taal-actie” model, dat niet alleen de wereld om zich heen kan analyseren, maar ook een robot kan instrueren hoe te bewegen. Het zet de bewegingen van de robot om in een reeks getallen, die worden opgenomen in dezelfde trainingsgegevens als het taalmodel. Net zoals chatbots het volgende woord in een zin kunnen voorspellen, kan RT-2 voorspellen hoe de arm van een robot moet bewegen om een bepaalde actie uit te voeren.
De robot is in staat om indrukwekkende taken uit te voeren, complexe instructies op te volgen en zelfs abstracte verbindingen te maken tussen gerelateerde concepten. Het is echter niet foutloos, met af en toe geobserveerde onnauwkeurigheden in objectidentificatie en begrip.