Anthropic lanza el modelo de IA Opus 4.7, centrándose en codificación, tareas visuales y barreras de seguridad cibernética – Campus Technology

Anthropic lanza el modelo de IA Opus 4.7, centrándose en codificación, tareas visuales y barreras de seguridad cibernética

Anthropic ha presentado Claude Opus 4.7, un modelo de lenguaje grande actualizado que, según afirma, supera a su predecesor en tareas de ingeniería de software, análisis de imágenes y trabajo autónomo de varios pasos, al tiempo que mantiene el precio en 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.





El modelo ahora está disponible de forma generalizada en los propios productos de Anthropic y a través de su API, así como en Amazon Bedrock, Vertex AI de Google Cloud y Microsoft Foundry.

Anthropic dijo que la actualización ofrece las ganancias más pronunciadas en tareas de codificación exigentes. Los usuarios informan que pueden realizar trabajos de codificación difíciles que antes requerían una estrecha supervisión, y que el nuevo modelo maneja tareas complejas y de larga duración con mayor coherencia y prestando más atención a las instrucciones.

La compañía también dijo que el modelo puede verificar sus propios resultados antes de informar los resultados en comparación con los usuarios, un comportamiento que describió como nuevo en comparación con versiones anteriores.

En visión, Opus 4.7 ahora puede aceptar imágenes de hasta 2.576 píxeles en el borde largo, aproximadamente 3,75 megapíxeles, más de tres veces la resolución admitida por los modelos Claude anteriores.

Anthropic dijo que esto amplía la utilidad del modelo para tareas que requieren detalles visuales finos, incluida la lectura de capturas de pantalla densas y la extracción de datos de diagramas complejos.

Quizás el aspecto más notable del lanzamiento es su papel en la estrategia más amplia de implementación de seguridad de Anthropic. La compañía anunció recientemente el Proyecto Glasswing, que destacó tanto los riesgos como los beneficios potenciales de la IA para la ciberseguridad, y declaró que mantendría restringido su modelo Claude Mythos Preview, más poderoso, mientras probaba primero nuevas salvaguardas cibernéticas en sistemas menos capaces. Opus 4.7 es el primer modelo de este tipo.

Anthropic dijo que experimentó durante el entrenamiento reduciendo selectivamente las capacidades de ciberseguridad de Opus 4.7 y está lanzando el modelo con salvaguardas automáticas diseñadas para detectar y bloquear solicitudes que indiquen usos de ciberseguridad prohibidos o de alto riesgo.

La compañía agregó que los hallazgos de este despliegue informarán su eventual lanzamiento más amplio de lo que llama modelos de «clase Mythos». Los profesionales de seguridad que deseen utilizar el nuevo modelo con fines legítimos, como investigación de vulnerabilidades o pruebas de penetración, pueden presentar su solicitud a través de un nuevo Programa de Verificación Cibernética.

En cuanto a la alineación, las evaluaciones de Anthropic muestran que Opus 4.7 exhibe bajos índices de comportamiento preocupante, como engaño, adulación y cooperación con el mal uso, y se desempeña mejor que su predecesor en honestidad y resistencia a ataques maliciosos de inyección rápida. Sin embargo, la compañía reconoció que el modelo es modestamente más débil en algunas áreas, incluida la tendencia a brindar consejos demasiado detallados sobre la reducción de daños relacionados con sustancias controladas.

La evaluación de alineación interna de Anthropic describió el modelo como «en gran medida bien alineado y confiable, aunque no completamente ideal en su comportamiento», y señaló que Mythos Preview sigue siendo el modelo mejor alineado que la compañía ha entrenado.

Los desarrolladores que actualicen desde Opus 4.6 deberían tener en cuenta dos cambios relacionados con los costos. Opus 4.7 utiliza un tokenizador actualizado que puede asignar la misma entrada a aproximadamente entre 1,0 y 1,35 veces más tokens, según el tipo de contenido. El modelo también produce más tokens de salida en niveles de esfuerzo más altos, particularmente en turnos posteriores de tareas de agencia, porque involucra más razonamiento.

Anthropic dijo que los usuarios pueden administrar el consumo de tokens a través de un parámetro de esfuerzo, presupuestos de tareas o solicitando que el modelo sea más conciso.

Junto con el lanzamiento del modelo, Anthropic introdujo un nuevo nivel de esfuerzo «xhigh», ubicado entre las configuraciones «alta» y «máxima» existentes, lo que brinda a los desarrolladores un control más preciso sobre la compensación entre profundidad de razonamiento y latencia. En Claude Code, el nivel de esfuerzo predeterminado se elevó a «xhigh» para todos los planes.

La compañía también lanzó presupuestos de tareas en versión beta pública en su plataforma API y agregó un nuevo comando «/ultrareview» en Claude Code que lee los cambios de código y señala errores y problemas de diseño.

Para obtener más información, visite el sitio de Anthropic.

Sobre el autor



John K. Aguas es el editor en jefe de varios sitios Converge360.com, centrándose en el desarrollo de alto nivel, la inteligencia artificial y la tecnología del futuro. Ha estado escribiendo sobre tecnologías de vanguardia y la cultura de Silicon Valley durante más de dos décadas y ha escrito más de una docena de libros. También coescribió el documental. Silicon Valley: un renacimiento de 100 añosque se transmitió por PBS. Se le puede contactar en [email protected].




We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept