El lunes, Anthropic anunció Opus 4.5, la última versión de su modelo insignia. Tras el lanzamiento de Sonnet 4.5 en septiembre y Haiku 4.5 en octubre, es el último modelo de la serie 4.5 de Anthropic que llega al mercado.
Como se esperaba, la nueva versión de Opus ofrece el máximo rendimiento en una variedad de pruebas comparativas, incluidas pruebas comparativas de codificación (SWE Bench y Terminal Bench), uso de herramientas (Tau2 Bench y MCP Atlas) y resolución de problemas generales (ARC-AGI 2, GPQA Diamond).
Lo que es notable es que Opus 4.5 es el primer modelo en obtener una puntuación superior al 80 por ciento en SWE Bench, un respetado punto de referencia de codificación.
Anthropic también enfatizó el uso de computadoras y las capacidades de hojas de cálculo del Opus y lanzó una serie de productos paralelos para mostrar cómo se desempeña el modelo en estos entornos. Junto con Opus 4.5, Anthropic hará que sus productos Claude para Chrome y Claude para Excel, anteriormente en fase piloto, estén más ampliamente disponibles. La extensión de Chrome estará disponible para todos los usuarios de Max, mientras que el modelo centrado en Excel estará disponible para los usuarios de Max, Team y Enterprise.
Opus 4.5 también proporciona mejoras de memoria para operaciones de contexto largo, que requirieron cambios significativos en la gestión de memoria del modelo.
“Hemos realizado mejoras en la calidad general de los contextos largos en el entrenamiento con Opus 4.5, pero las ventanas de contexto por sí solas no serán suficientes”, dijo a TechCrunch Dianne Na Penn, jefa de gestión de productos para investigación de Anthropic. “Es realmente importante conocer los detalles correctos para recordar, además de tener una ventana de contexto más larga”.
Estos cambios también habilitaron una función de “chat sin fin” solicitada desde hace mucho tiempo para los usuarios de Claude que pagan, lo que permite que los chats continúen sin interrupción cuando el modelo llega a su ventana de contexto. En cambio, el modelo comprime su memoria contextual sin advertir al usuario.
Evento tecnológico
san francisco
|
13 al 15 de octubre de 2026
Muchas de las actualizaciones se están realizando teniendo en cuenta los casos de uso de agentes, particularmente escenarios en los que Opus actúa como el agente principal y comanda un grupo de subagentes asistidos por Haiku. Realizar estas tareas requiere un buen dominio de la memoria de trabajo, y aquí es donde las mejoras en la memoria descritas por Penn muestran su valor.
“Aquí es donde conceptos básicos como la memoria se vuelven realmente importantes”, dice Penn, “porque Claude necesita poder explorar bases de código y documentos grandes y también saber cuándo retroceder y volver a verificar algo”.
Opus 4.5 enfrentará una fuerte competencia de otros modelos Frontier lanzados recientemente, en particular GPT 5.1 de OpenAI (lanzado el 12 de noviembre) y Gemini 3 de Google (lanzado el 18 de noviembre).