Nuevos modelos de inteligencia artificial de Anthrope: Claude Opus 4 y Claude Sonnet 4

El rival de Operai Anthrope anunció que se han lanzado los nuevos modelos de inteligencia artificial Claude Opus 4 y Claude Sonnet 4. Según Anthrope, estos modelos establecen nuevos estándares para la codificación, el razonamiento avanzado y los agentes de inteligencia artificial.

Detalles de Claude Sonnet 4 y Claude Opus 4

Según la información compartida; Claude Sonnet 4 se posiciona como la actualización de Claude Sonnet 3.7. Claude Sonnet 4, que se destaca con sus capacidades de codificación y razonamiento más avanzadas, ofrece una respuesta más precisa a las instrucciones. Además de otras tareas, el Claude Opus 4, diseñado para la codificación, ofrece un rendimiento continuo para tareas complejas y a largo plazo y flujos de trabajo de agentes.

Claude Opus 4 es el modelo más poderoso de antrópico hasta la fecha. El modelo recibió el 72.5 por ciento en el banco SWE y el 43.2 por ciento en el banco terminal. Claude Opus 4 puede proporcionar un rendimiento continuo durante varias horas de tareas que consisten en miles de pasos.

Según Anthrope, Claude Opus 4 coincide con el O3, GPT-4.1 y Gemini de OpenAI en las pruebas de referencia en los campos de la respuesta multilingüe, uso de vehículos de agentes, codificación terminal de agentes, codificación de agentes y niveles de posgrado.

Sin embargo, Claude Sonnet 4 está lejos de hacer coincidir OPUS 4 en la mayoría de las áreas. Sin embargo, según antrópico, este modelo fue diseñado para proporcionar una mezcla óptima de talento y practicidad.

https://www.youtube.com/watch?v=oquclc3gqks

Ambos modelos han ampliado la función de pensamiento en la versión beta. Del mismo modo, los modelos pueden usar la búsqueda web y otras herramientas. Por lo tanto, Claude podrá cambiar entre razonamiento y uso de vehículos cuando use modelos. Además, es útil agregar que los vehículos se pueden usar en paralelo. Al mismo tiempo, cuando permite que los modelos accedan a archivos locales, digamos que se desarrollará la memoria del modelo. Claude, por otro lado, puede registrar información importante para mantener la continuidad y crear conocimiento con el tiempo.

Pro, Max, Team y Enterprise Claude Planes suscriptores a los usuarios, Claude Opus 4 y Claude Sonnet 4 podrán acceder. Sonnet 4 también puede ser utilizado por usuarios gratuitos. Se ofrecieron modelos a los desarrolladores a través de la API antrópica, el lecho de roca de Amazon y la IA de vértices de Google Cloud. El Opus 4 se ofrece a los desarrolladores con costos de $ 15/75 como un millón de token y $ 15/75, y el soneto 4 es entrada/salida.

Preocupaciones de seguridad para Claude Opus 4

Aquí, vale la pena mencionar los hallazgos de la tercera investigación del Instituto de Investigación de Investigación de la Parte del Anthrope, Apollo Research, donde está trabajando Claude Opus 4. Apollo aconsejó no usar una versión temprana del modelo debido a la tendencia a la conspiración y el engaño. Apollo descubrió que Opus 4 era mucho más proactivo en los intentos de demoler en comparación con los modelos anteriores y, a veces, duplicaba su engaño cuando se les hizo preguntas. Anthrope dice que estos errores en el Claude Opus 4 se han solucionado.

Innovaciones de Claude Code

https://www.youtube.com/watch?v=l_wfegry87m

Mientras tanto, compartamos que la herramienta de codificación de agente de Anthrope, Claude Code, ahora puede usarse ampliamente después de las pruebas. Claude Code ahora admite tareas de fondo a través de integraciones locales con actos de GitHub, VS Code y JetBrains. El vehículo muestra las ediciones directamente en sus archivos.

Al aumentar el enfoque del desarrollador, Anthrope anunció que los desarrolladores han ofrecido cuatro nuevas habilidades para el uso de agentes de inteligencia artificiales más potentes en la API antrópica. Estas habilidades son la capacidad de la herramienta de ejecución de código, MCP Binder, API de archivos y reclamos de comando hasta una hora.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept