Dos nuevos modelos de la clase Mythos de Anthropic que destacan por su potente rendimiento: Fable 5 y Mythos 5

Anthropic ha lanzado Claude Fable 5, el primer lanzamiento público de su tan comentado modelo de ciberseguridad Mythos. Según Anthropic, Fable 5 demuestra un rendimiento superior en ingeniería de software, procesamiento de información y procesamiento visual. Sin embargo, el modelo viene con estrictas limitaciones de seguridad. El modelo se remonta a Claude Opus 4.8 al bloquear respuestas en áreas de alto riesgo como la ciberseguridad, la biología, la química y la destilación. Aún así, Anthropic afirma que las situaciones en las que Fable tiene que recurrir al Opus 4.8 son raras. Según los primeros datos compartidos por la empresa; Al menos el 95 por ciento de las sesiones de Fable estuvieron impulsadas enteramente por las propias respuestas del modelo.

Mythos, que se lanzó en versión preliminar en abril, estuvo inicialmente disponible para un número limitado de socios debido a preocupaciones de ciberseguridad. La semana pasada, Anthropic dio acceso al modelo a cientos de organizaciones en 15 países. La compañía está poniendo a disposición del público Fable 5, una nueva versión de Mythos, a través de la API Claude de Anthropic y planes empresariales basados ​​en el consumo.

Anthropic señala que Fable 5 puede funcionar sin supervisión durante más tiempo y de forma más independiente que los modelos anteriores de Claude. Según la declaración de la empresa de análisis Hex en el marco de pruebas de terceros, Fable es el primer modelo que obtiene una puntuación del 90 por ciento en el criterio de análisis básico, que consiste en tareas analíticas complejas y duraderas.

A Anthropic le preocupa el mal uso de un modelo de clase Mythos. Es por eso que la compañía puso a prueba sus clasificadores con intentos de jailbreak antes de lanzar Fable 5. Anthropic declaró lo siguiente en su declaración:

«Ejecutamos internamente un programa externo de recompensas por errores que no logró producir jailbreaks universales en más de 1000 horas de pruebas. Luego trabajamos con organizaciones externas del equipo rojo que no lograron lograr jailbreaks universales».

Con el lanzamiento de Fable 5 y Mythos 5, Anthropic afirma que todo el tráfico deberá retenerse durante 30 días debido a riesgos de ciberseguridad. También se incluirán en este proceso las empresas que anteriormente tenían acuerdos de custodia cero. La empresa afirma que no utilizará los datos con fines de formación y sólo los utilizará para defenderse de ataques nuevos y complejos, incluidos nuevos jailbreak, y para detectar y reducir los falsos positivos. El acceso a modelos más potentes en el futuro también puede traer consigo políticas obligatorias de retención de datos enmarcadas como medidas de seguridad.

Hasta el 22 de junio, Fable 5 se incluirá en los planes Pro, Max, Team y Enterprise basados ​​en licencia sin costo adicional. El 23 de junio, Anthropic eliminará Fable 5 de estos planes y requerirá créditos de uso a partir de ahora; pero planea traer esto nuevamente como una característica de suscripción estándar lo antes posible. Para los desarrolladores, Fable 5 está disponible como claude-fable-5 a través de la API de Claude.

Mitos 5

Anthropic también ofrece una nueva versión de Mythos, llamada Mythos 5, a las organizaciones a las que se les ha otorgado acceso al modelo avanzado. Fable 5 y Mythos 5 parecen compartir el mismo nivel básico de talento. La diferencia entre estos dos modelos es el control de acceso. La facilidad con la que los usuarios pueden acceder a los modelos y las medidas de seguridad integradas en cada uno varían. Mythos 5 elimina algunas de las restricciones que vimos en Fable 5 para usuarios confiables que operan en dominios aprobados. De esta manera, Mythos 5 emerge como un modelo más sólido para estudios cibernéticos y biológicos sensibles, ya que puede responder a áreas donde Fable 5 se queda corto. Por otro lado, según Anthropic; Para las tareas empresariales y de desarrollo más comunes, Fable 5 funciona a la par con Mythos 5.

Actuación de Fable 5 y Mythos 5

Según Anthropic: En SWE-bench Pro, que mide la capacidad para completar tareas desafiantes de ingeniería de software, Fable 5 y Mythos 5 lograron el 80,3 por ciento. El modelo supera ampliamente al último y mejor modelo general de OpenAI, GPT-5.5, que obtuvo una puntuación del 58,6 por ciento en esta métrica. En el punto de referencia FrontierCode Diamond de Cognition, los modelos obtuvieron una puntuación del 29,3 por ciento, mientras que Claude Opus 4.8 obtuvo una puntuación del 13,4 por ciento y GPT-5.5 obtuvo una puntuación del 5,7 por ciento.

Stripe describe el rendimiento de codificación del modelo con las siguientes declaraciones:

«Fable 5 reduce meses de trabajo de ingeniería a días. En nuestra base de código Ruby de 50 millones de líneas, completó en un día un trabajo que habría llevado más de dos meses si lo hubiéramos hecho manualmente».

Además de las tareas de codificación, Anthropic está posicionando a Fable 5 como un modelo más sólido para el trabajo de información empresarial. Según los datos compartidos por la empresa; En GDPval-AA, Fable 5 y Mythos 5 obtuvieron 1932 puntos, mientras que Claude Opus 4.8 obtuvo 1890, GPT-5.5 obtuvo 1769 y Gemini 3.1 Pro obtuvo 1314. En GDPpdf, un punto de referencia centrado en el razonamiento de documentos visuales, Fable 5 y Mythos 5 lograron obtener un 29,8 por ciento sin las herramientas. Si bien esta tasa fue del 22,5 por ciento para Opus 4.8, fue del 24,9 por ciento para GPT-5.5 y del 16,7 por ciento para Gemini 3.1 Pro.

Tanto Fable 5 como Mythos 5 tienen un precio de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, que es el doble que Opus 4.8. Podemos decir que los modelos llaman la atención por su elevado precio.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept