Este cerebro robótico de código abierto piensa en 3D

Los robóticos europeos hoy lanzó un poderoso modelo de inteligencia artificial de código abierto que actúa como cerebro para robots industriales, ayudándolos a captar y manipular cosas con nueva destreza.

El nuevo modelo, SPEAR-1, fue desarrollado por investigadores del Instituto de Ciencias de la Computación, Inteligencia Artificial y Tecnología (INSAIT) de Bulgaria. Puede ayudar a otros investigadores y nuevas empresas a construir y experimentar con hardware más inteligente para fábricas y almacenes.

Así como los modelos de lenguaje de código abierto han hecho posible que investigadores y empresas experimenten con IA generativa, Martin Vechev, científico informático de INSIAT y ETH Zurich, dice que SPEAR-1 debería ayudar a los robóticos a experimentar e iterar rápidamente. «Los modelos de peso abierto son cruciales para avanzar en la IA incorporada», dijo Vechev a WIRED antes del lanzamiento.

SPEAR-1 se diferencia de los modelos básicos de robots existentes en que incorpora datos 3D en su combinación de entrenamiento. Esto le da al modelo una mejor comprensión del mundo físico, lo que facilita la comprensión de cómo se mueven los objetos a través del espacio físico.

Los modelos básicos de robots generalmente se construyen sobre modelos de lenguaje de visión (VLM) que tienen una comprensión amplia pero limitada del mundo físico porque el entrenamiento tiende a provenir de imágenes 2D etiquetadas. «Nuestro enfoque aborda el desajuste entre el espacio 3D en el que opera el robot y el conocimiento del VLM que forma el núcleo del modelo básico robótico», dice Vechev.

SPEAR-1 es aproximadamente tan capaz como los modelos básicos comerciales diseñados para operar robots, cuando se mide en RoboArena, un punto de referencia que prueba la capacidad de un modelo para lograr que un robot haga cosas como apretar una botella de ketchup, cerrar un cajón y grapar trozos de papel.

La carrera para hacer que los robots sean más inteligentes ya tiene miles de millones de dólares en juego. El potencial comercial de robots generalmente capaces ha generado nuevas empresas bien financiadas, incluidas Skild y Generalist, además de Physical Intelligence. SPEAR-1 es casi tan bueno como Pi-0.5 de Physical Intelligence, una startup de mil millones de dólares fundada por un equipo estelar de investigadores de robótica.

SPEAR-1 sugiere que la búsqueda para construir robots más inteligentes puede involucrar tanto modelos cerrados como los de OpenAI, Google y Anthropic, como variantes de código abierto como Llama, DeepSeek y Qwen.

Sin embargo, la inteligencia de los robots todavía está en sus primeras etapas. Es posible entrenar un modelo de IA para que opere un brazo robótico de modo que pueda recoger de manera confiable ciertos objetos de una mesa. En la práctica, sin embargo, será necesario volver a entrenar el modelo desde cero si se utiliza un tipo diferente de brazo robótico o si se modifica el objeto o el entorno.

Comparte esto: