Mercado de pruebas antrópicas donde los agentes de IA comercian con dinero real

Como parte de una prueba llamada Project Deal, Anthropic creó un mercado donde los agentes de inteligencia artificial desempeñan el papel de compradores y vendedores, haciendo negocios reales a cambio de productos reales y dinero real. Según la información compartida; Project Deal es un experimento piloto con un grupo de participantes autoseleccionados.

Se afirma que el experimento duró una semana en diciembre de 2025 y en realidad es una continuación del experimento «Project Vend» que Anthropic realizó anteriormente. Entre los participantes se encontraban 69 empleados de Anthropic a quienes se les dio un presupuesto de $100, pagado mediante tarjetas de regalo, para comprar artículos de sus compañeros de trabajo. Claude habla con cada empleado individualmente para saber qué quieren vender, cuánto quieren pedir y sus preferencias en el estilo de negociación, luego crea un mensaje de sistema personalizado con esta información. Una vez iniciado el experimento, caminó sin intervención humana alguna. Según Antrópico; En Project Deal se realizaron 186 transacciones por un valor total de más de 4 mil dólares. La empresa quedó impresionada con lo bien que funcionó Project Deal.

Anthropic opera cuatro mercados separados con diferentes modelos, uno real y los otros tres con fines de investigación. En el mercado definido como real, todo el mundo está representado por el modelo más avanzado de la empresa y, tras el experimento, los acuerdos se concretan.

Según informó Anthropic; cuando los usuarios están representados por modelos más avanzados, logran resultados objetivamente mejores. Lo que aquí se menciona es la posibilidad de que el perdedor no se dé cuenta de que su situación es peor. Se afirma que la razón de esta situación son las diferencias en la calidad de los agentes.

La diferencia entre Haiku y Opus se apoya en ejemplos concretos. Cuando el mismo producto estaba representado por diferentes modelos, Opus cobraba de más un promedio de 3,64 dólares. Más sorprendentemente, en el mismo trío comprador-vendedor-producto, una bicicleta plegable rota se vendió por 38 dólares a través de Haiku y 65 dólares a través de Opus, una diferencia del 70 por ciento. Los participantes que utilizaron Opus realizaron una media de 2,07 transacciones más.

Mientras que algunos participantes le dijeron al agente «negocie duro, haga una oferta baja», otros le dieron instrucciones como «tratará con mis colegas, es importante parecer educado». Al observar los resultados, se vio que estas instrucciones no tenían un efecto estadísticamente significativo sobre la probabilidad de venta, el precio alcanzado o el monto pagado. Por tanto, las instrucciones iniciales dadas a los agentes no afectaron la probabilidad de ventas ni los precios negociados.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept