DeepSeek ha anunciado el avance de la versión V4 con dos modelos abiertos denominados Pro y Flash. La empresa ha revelado que el modelo V4-Pro utiliza un total de 1,6 billones de parámetros, mientras que el modelo V4-Flash 284 000 millones de parámetros en total . Ambos modelos ofrecen una ventana de contexto de 1 millón de tokens , lo que los convierte en una opción importante para los desarrolladores que trabajan con bases de código extensas y análisis de documentos.
En cuanto a V4-Pro, DeepSeek se centra en tareas de codificación y de agente con una arquitectura MoE de 49 000 millones de parámetros activos. La página de Hugging Face también indica que los modelos se distribuyen con pesos abiertos bajo licencia MIT. Esto abre la puerta a la ejecución local para los equipos que no desean utilizar una API en la nube, aunque hay que señalar que V4-Pro requiere una gran cantidad de memoria de GPU.
El aspecto del precio hace que la noticia sea aún más importante. La página de precios de DeepSeek muestra para V4-Pro un nivel de 3,48 dólares por cada millón de tokens de salida. Esta cifra modifica directamente el cálculo de costes para los equipos que desarrollan aplicaciones de IA a gran escala.
Nueva versión en el ámbito de los modelos abiertos
DeepSeek sostiene que V4-Pro ofrece resultados sólidos en pruebas como Codeforces y LiveCodeBench. Sin embargo, AP destaca especialmente la necesidad de una verificación independiente de las afirmaciones de la empresa sobre los benchmarks. En resumen, V4 acelera la competencia en el ámbito de los modelos abiertos, pero los desarrolladores deben tomar su decisión definitiva basándose en pruebas realizadas con sus propias cargas de trabajo.
