El desarrollador de Kimi, Moonshot AI, con sede en China, lo describió ayer como el modelo de código abierto más poderoso hasta la fecha. Algunos K2.5Él presentó. Desarrollado con entrenamiento previo continuo en aproximadamente 15T tokens visuales y de texto mixtos, K2.5 aparece como un modelo multimodal local. Basado en Kimi K2, Kimi K2.5 se destaca por sus capacidades de codificación y visión, así como por su función Agent Swarm autogestionada.
Algunos K2.5 pueden dirigir de forma autónoma un enjambre de hasta 100 subagentes para misiones complejas como parte de su función Agent Swarm. Además, el modelo puede ejecutar flujos de trabajo paralelos en hasta 1500 llamadas de herramientas. Según la empresa; En comparación con una configuración de agente único, esto reduce el tiempo de ejecución hasta 4,5 veces. Kimi K2.5 crea y coordina automáticamente el enjambre de agentes sin subagentes ni flujo de trabajo predefinidos. En tres pruebas comparativas de agentes (HLE, BrowseComp y SWE-Verified), Kimi K2.5 ofrece un rendimiento sólido a un costo mucho menor.
Entrenado con Parallel Agent Reinforcement Learning (PARL), K2.5 ejecuta flujos de trabajo paralelos en hasta 1500 pasos coordinados mientras aprende a gestionar de forma autónoma un enjambre de hasta 100 subagentes. Además, realiza este proceso sin roles predefinidos ni flujos de trabajo creados manualmente.
Según la empresa, Agent Swarm mejora el tiempo de actividad de un extremo a otro al tiempo que permite cargas de trabajo más complejas y de largo plazo. 80 por ciento de reducción proporciona. Agent Swarm toma los pasos críticos mínimos necesarios para lograr el rendimiento objetivo en comparación con la ejecución de un solo agente en un escenario de búsqueda grande. de 3 a 4,5 veces Se reduce. A medida que aumentan los objetivos, también aumentan los ahorros, lo que da como resultado un mayor tiempo de reloj mediante la paralelización. Una reducción de hasta 4,5 veces se ve.
Además, K2.5 puede convertir conversaciones simples en interfaces de usuario completas y aplicar animaciones enriquecidas, como diseños interactivos y efectos activados por desplazamiento. Más allá de los comandos de texto, K2.5 también destaca en la codificación visual. Al analizar imágenes y videos, K2.5 mejora la generación de códigos de imágenes/videos y la depuración visual.
K2.5 también demuestra un rendimiento notable en tareas de ingeniería de software del mundo real. Según algunos criterios de Code Bench; K2.5 tiene mejoras consistentes y significativas sobre K2 en todos los tipos de tareas. Para tareas de ingeniería de software, se recomienda utilizar Kimi K2.5 junto con el nuevo producto de codificación de la empresa, Kimi Code. Se puede integrar con varios IDE, incluidos Kimi Code, VSCode, Cursor y Zed, que se ejecutan en su terminal. El código Kimi de código abierto admite imágenes y videos como entrada. Además, Kimi Code descubre automáticamente las habilidades y MCP existentes y los lleva a su entorno de trabajo en Kimi Code. También puede aprovechar las herramientas que ofrece K2.5 Agent para probar las capacidades de codificación del agente K2.5.
Además, K2.5 Agent es capaz de manejar trabajo de oficina intensivo y de gran escala de principio a fin. Al evaluar entradas grandes y de alta intensidad, el agente K2.5 coordina el uso de herramientas de varios pasos. La compañía dice que K2.5 Agent ofrece resultados de nivel experto, incluidos documentos, hojas de cálculo, archivos PDF y presentaciones de diapositivas, a través de voz directa.
Kimi K2.5 se puede utilizar a través de Kimi.com, Kimi Application, API y Kimi Code. Además, Kimi.com y Kimi Application comenzaron a admitir 4 modos: K2.5 Instant, K2.5 Thinking, K2.5 Agent y K2.5 Agent Swarm (Beta).
También hay créditos gratuitos disponibles para usuarios pagos de alto nivel para Agent Swarm, que actualmente se encuentra en versión beta en Kimi.com.
