Nuevo modelo de inteligencia artificial centrado en la codificación de la IA Mistral: Devstral

El intento de inteligencia artificial basado en francés Mistral anunció ayer que el nuevo modelo de inteligencia artificial se centró en la codificación, Devstral. Mistral desarrolló a Devstral conjuntamente con la compañía de inteligencia artificial All Hands Ai. El modelo ha estado disponible bajo la licencia Apache 2.0. En resumen, Devstral se puede usar sin restricción con fines comerciales.

Según Mistral, Devstral deja atrás el criterio verificado de SWE-Bench que mide las habilidades de codificación, dejando a Gemma 3 27b de Google y otros modelos abiertos, como el V3 de Deepseek. En este punto, la precisión de Devstral se aprueba manualmente por el Banco SWE verificado, un conjunto de datos que consta de 500 problemas reales de GitHub.

Mistral dice que es perfecto en el uso de herramientas para explorar las suelas de código de Devstral, editar múltiples archivos y fortalecer los agentes de ingeniería de software. Según la información compartida; Devstral está trabajando en el esqueleto del código, como OpenHands o SWE-agent, que define la interfaz entre el modelo y los escenarios de prueba. Mistral Small 3.1 se realizó utilizando técnicas de aprendizaje de refuerzo y armonización de seguridad para el desarrollo del modelo.

Además, se enfatiza que el modelo es una opción ideal para la distribución local y el uso en el dispositivo. Según la transferencia de la compañía; Devstral con un parámetro de 24 mil millones, lo suficientemente ligero como para trabajar en una Mac con un solo NVIDIA RTX 4090 o 32 GB de RAM.

De hecho, este no es el primer modelo de Mistral centrado en la codificación. La compañía se ha centrado previamente en las tareas de escritura de código. Codestral se le ocurrió. Sin embargo, Codestral no se publicó bajo una licencia que permitió a los desarrolladores usar el modelo para aplicaciones comerciales. En este sentido, podemos decir que Devstral satisfará las necesidades comerciales de los desarrolladores.

Con la versión de vista previa de la investigación, Devstral se puede descargar de las plataformas de desarrollo de IA, incluido Huging Face. También es posible usar Devstral a través de la API de Mistral. El precio del modelo es de 0.1 dólares por millón de tokens de entrada y un millón de token de salida es de 0.3 dólares por token. Además, el Mistral afirma que la compañía trabaja intensamente para crear un modelo de codificación de agente más grande para estar disponible en las próximas semanas.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept