Aprendizaje por refuerzo impulsa al robot P1 de LimX Dynamics en una desafiante prueba de montaña

Aprendizaje por refuerzo impulsa al robot P1 de LimX Dynamics en una desafiante prueba de montaña

La firma de tecnología robótica china LimX Dynamics ha llevado a cabo exitosamente una demostración de su robot bípedo P1, destacando su capacidad para atravesar con eficacia a través de terrenos montañosos y responder de manera óptima ante posibles amenazas humanas. Utilizando el método de aprendizaje por refuerzo, el P1 demostró su habilidad para adaptarse a estímulos externos como obstáculos en movimiento o terrenos irregulares. Este enfoque de aprendizaje por refuerzo es una parte clave de las técnicas empleadas en el entrenamiento de algoritmos de inteligencia artificial. LimX Dynamics, también conocida como Zhuji Dynamics, continúa su dedicación al desarrollo constante de tecnologías robóticas, con el P1 representando uno de sus productos destacados junto con un robot humanoide y un robot cuadrúpedo. La reciente prueba en la montaña Tanglang de Shanghai sirvió para demostrar la capacidad del P1 para adaptarse y operar eficientemente en entornos desafiantes y cambiantes.

LimX Dynamics ha revelado los resultados de la prueba a través de un artículo en Medium, donde destacan los desafíos únicos enfrentados durante la prueba del robot bípedo P1 en terrenos montañosos. La compañía señala que, a diferencia de entornos urbanos, las montañas presentan una topografía irregular sin escalones ni superficies uniformes. Esta evaluación del P1 marca la tercera prueba realizada por LimX Dynamics en su gama de productos, tras las pruebas anteriores con robots humanoides y cuadrúpedos. La más reciente, llevada a cabo en octubre del año pasado, involucró al robot cuadrúpedo X1 navegando por una fábrica de acero en el sur de China.

Como parte de la divulgación de los resultados, LimX Dynamics ha compartido un vídeo que muestra al P1 enfrentando varios desafíos en terreno montañoso. En las imágenes, se observa al robot escalando colinas cubiertas de hierba, superando zanjas y recuperándose rápidamente de tropiezos. Además, se destaca la capacidad del P1 para mantener la estabilidad ante patadas, tirones y golpes repetidos en las piernas con un palo, incluso llegando a romper el palo del entrenador con su resistencia. Aunque no se proporcionaron detalles sobre la distancia recorrida por el P1 en esta prueba específica, LimX Dynamics sí compartió información sobre el método de entrenamiento del robot mediante aprendizaje por refuerzo.

A diferencia de otros enfoques de aprendizaje automático, como el aprendizaje supervisado o no supervisado, que utilizan etiquetas de datos o las eliminan para entrenar modelos de software, el aprendizaje por refuerzo se basa en el sistema de recompensas o penalizaciones para guiar la toma de decisiones. Aunque los sistemas de aprendizaje automático comparten similitudes con los sistemas de inteligencia artificial en su autonomía de aprendizaje, se consideran subconjuntos dentro del campo más amplio de la Inteligencia Artificial.

LimX ha destacado que, a pesar de no haber empleado datos específicos del entorno para instruir al P1 durante la prueba, el robot logró navegar con éxito por un terreno complejo. La empresa tiene planes de aplicar tecnologías similares a su robot humanoide, el CL-1. Este androide completó una prueba a finales de diciembre, demostrando su capacidad para ascender escaleras y desplazarse tanto en interiores como en exteriores. Durante esta evaluación, el CL-1 fue capaz de incorporar datos sobre las escaleras y otros obstáculos antes de superarlos con éxito.