Le di un cuerpo físico a mi agente OpenClaw

recientemente di mi OpenClaw es un verdadero brazo robótico con el que jugar. Los resultados casi arruinaron mi propia red neuronal.

El agente de IA pudo configurar el brazo, usarlo para ver y agarrar cosas lentamente, e incluso entrenar otro modelo de IA para recoger y colocar objetos específicos. ¡Y dicen que todavía faltan algunos años para AGI! (Estoy bromeando, probablemente lo sea).

Los resultados me han convencido de que podemos estar al borde de un gran avance en robótica. Entrenar y controlar robots solía requerir una habilidad considerable. Los modelos de IA actuales pueden hacerlo casi fácil.

«La codificación impulsada por IA es muy interesante porque tiene el potencial de cerrar la brecha entre los métodos de ingeniería convencionales, que son confiables pero no se generalizan, y los modelos contemporáneos de visión, lenguaje y acción, que se generalizan pero aún no son confiables», dice Ken Goldberg, un robotista de UC Berkeley que está explorando este enfoque.

Compré un brazo prediseñado llamado LeRobot 101. Es parte de un proyecto de código abierto de HuggingFace que hace que sea relativamente barato comenzar a construir y experimentar con robótica.

El LeRobot viene con dos brazos: un brazo controlador que una persona opera usando un mango y un gatillo, y un brazo seguidor con una cámara que replica esos movimientos. Puedes entrenar un modelo de IA teleoperando el brazo controlador y haciendo que el modelo aprenda cómo mover al seguidor en respuesta a lo que ve en la cámara.

Construyendo con OpenClaw

Antes de usar OpenClaw, pasé varias horas intentando conectar y calibrar el robot, y en un momento casi rompí los motores al aplicar la configuración incorrecta, lo que provocó que se sobrecalentaran.

Luego, con la ayuda de OpenClaw y Codex, pude codificar por vibración un programa simple que cerraba la pinza de la garra cuando detectaba una bola roja. En la terminal, Codex realizó el complicado trabajo de configurar las conexiones con el robot. Luego, con mi ayuda, calibró las posiciones de sus articulaciones. También escribió un script en Python que utilizaba varias bibliotecas para identificar y agarrar la pelota en cuestión. La codificación por vibración no es perfecta, por supuesto, y las alucinaciones pueden introducir errores, especialmente cuando se trabaja con hardware diferente, pero los resultados fueron impresionantes.

Construyendo con OpenClaw

Comparte esto: