Te hablamos de Claude Managed Agents, la herramienta de Anthropic que acelera el proceso de desarrollo de agentes de inteligencia artificial. Anthropic anunció que le ha dado a Claude Managed Agents una nueva habilidad para soñar. La compañía afirma que al darles a los agentes de inteligencia artificial la capacidad de soñar, pueden recordar sus interacciones pasadas y el trabajo que han realizado. Así, los agentes podrán detectar errores repetidos y mejorar con el tiempo.
Anthropic permite a los agentes revisar eventos recientes e identificar recuerdos útiles que vale la pena conservar en sus memorias para informar futuras misiones e interacciones. La empresa lo describe como un conjunto de agentes configurables y prediseñados que se ejecutan en una infraestructura totalmente administrada. Esta capacidad está diseñada para situaciones en las que varios agentes trabajan en el mismo proyecto o tarea durante minutos u horas.
¿Qué ofrece la función de soñar?
Soñar permite a los agentes revisar sesiones anteriores y almacenes de memoria, extraer patrones de ellas y luego seleccionar recuerdos que pueden ser útiles en el futuro. Los usuarios podrán especificar con qué frecuencia quieren que sueñen sus agentes. Sin embargo, cabe señalar que los usuarios pueden elegir si permiten que el agente actualice automáticamente su memoria o revise los cambios antes de que se apliquen.
El hecho de que los modelos de lenguaje grandes operen con ventanas de contexto limitadas puede hacer que los agentes respaldados por estos modelos pierdan información importante mientras trabajan en tareas largas. Para solucionar esto, la mayoría de los modelos utilizan un proceso conocido como compresión. Limitado a una sola conversación por parte de un solo agente, este proceso de compresión analiza periódicamente conversaciones largas mientras intenta identificar la información más relevante para retener como contexto. Por otro lado, la función de soñar permite analizar sesiones pasadas y almacenes de memoria en múltiples agentes de inteligencia artificial. Así, señalemos que todos los agentes pueden conservar los recuerdos más importantes.
En la publicación de su blog, Anthropic explica el proceso de soñar de la siguiente manera:
Los sueños revelan patrones que un solo agente no puede ver por sí solo; Estos incluyen errores repetidos, flujos de trabajo acordados por los agentes y preferencias compartidas en todo el equipo. También reconstruye la memoria, asegurando que mantenga una alta intensidad de la señal a medida que evoluciona. Esto es especialmente útil para estudios a largo plazo y coordinación de múltiples agentes.
Para utilizar la capacidad de soñar, que actualmente se encuentra en fase preliminar de investigación, los desarrolladores deben solicitar acceso a la función.
Nuevas características: Coordinación multiagente y resultados.
Además, Anthropic anunció que pondrá a disposición de una audiencia más amplia sus funciones de resultados y coordinación de múltiples agentes, que anteriormente estaban en versión preliminar, a partir de hoy. La coordinación entre múltiples agentes permite a los agentes administrados dividir tareas complejas en trabajos más pequeños y hacer que un agente principal las asigne a diferentes subagentes. Cuando los usuarios aprovechen esta función, podrán controlar la consola Claude y ver exactamente qué está haciendo cada subagente para completar una misión. Asimismo, será posible examinar los procesos y resultados de cada agente.
En la función de resultados, los usuarios podrán crear un ejemplo ideal de resultados para cada tarea que asignen a un agente de inteligencia artificial. Después de este paso, un agente de evaluación independiente evaluará los resultados del agente con respecto a esta muestra. Por lo tanto, el agente de evaluación se asegurará de que el resultado entregado cumpla con el estándar esperado.
Estas nuevas funciones ahora están disponibles en la versión beta pública de Agentes administrados. Por cierto, vale la pena agregar que Anthropic ahora ofrece 10 horas de uso para los suscriptores Pro y Max, duplicando el límite de uso existente de cinco horas.
