Dynamic Workflows
Claude genera un plan, despliega cientos de subagentes en paralelo y verifica los resultados antes de reportar. Migraciones a escala de cientos de miles de líneas en Claude Code.
Research previewEl modelo más capaz y honesto de Anthropic hasta la fecha. Razonamiento profundo, programación agéntica de largo alcance y trabajo de alta autonomía — con una nueva clase de fiabilidad.
Nuevas capacidades de agente, controles para desarrolladores y un salto en honestidad y alineación — todo disponible desde el primer día.
Claude genera un plan, despliega cientos de subagentes en paralelo y verifica los resultados antes de reportar. Migraciones a escala de cientos de miles de líneas en Claude Code.
Research previewUn nuevo control junto al selector de modelo en claude.ai y Cowork. Elige cuánto esfuerzo dedica Claude: más profundidad o más velocidad. Por defecto, esfuerzo high.
claude.ai · CoworkHasta 2.5× más tokens de salida por segundo desde el mismo modelo. Y ahora tres veces más barato que en modelos anteriores. Disponible como research preview en la Claude API.
2.5× velocidadContexto de 1 millón de tokens por defecto en la Claude API, Amazon Bedrock y Vertex AI, con hasta 128k tokens de salida. Conversaciones y bases de código enteras en una sola sesión.
128k de salidaRazona solo cuando el turno lo requiere: responde directo en consultas simples y reflexiona en problemas complejos. Menos tokens de pensamiento desperdiciados que en Opus 4.7.
Calibrado por turnoInserta instrucciones role: "system" en cualquier punto del bucle agéntico sin reescribir el prompt completo — preservando los aciertos de prompt cache y reduciendo el coste.
4× menos probable que Opus 4.7 de dejar pasar fallos en su propio código sin señalarlos. Más propenso a admitir incertidumbre y menos a afirmar progreso sin evidencia suficiente.
Alineación ~MythosMenos casos de omitir una llamada a herramienta que la tarea requería — uno de los puntos que algunos usuarios reportaron en Opus 4.7. Comportamiento agéntico más fiable de extremo a extremo.
Menos omisionesEl mínimo de prompt cacheable baja a 1,024 tokens. Prompts que eran demasiado cortos para cachear en Opus 4.7 ahora crean entradas de cache sin cambios de código.
1,024 tokensOpus 4.8 supera a Opus 4.7 y a GPT-5.5 en programación agéntica, uso de computadora y navegación autónoma.
Además: única IA en completar todos los casos del benchmark Super-Agent de extremo a extremo, y la puntuación más alta registrada en el Legal Agent Benchmark — primera en superar el 10 % en el estándar all-pass.
Mismo precio, misma ventana de contexto — y una mejora medible en casi todas las dimensiones que importan para el trabajo agéntico.
| Dimensión | Opus 4.7El estándar anterior | Opus 4.8El nuevo flagship |
|---|---|---|
| SWE-Bench Pro Programación agéntica | 64.3 % | 69.2 % ▲ +4.9 pts |
| OSWorld-Verified Uso de computadora | 82.8 % | 83.4 % ▲ mejor |
| Online-Mind2Web Agente de navegador | ~76 % | 84 % ▲ el más fuerte |
| Honestidad en código Fallos sin señalar | Línea base | 4× menos probable ▲ honestidad |
| Contexto largo Trazas agénticas largas | Más compactaciones | Menos compactaciones, mejor recuperación |
| Uso de herramientas Tool triggering | Omisiones reportadas | Menos llamadas omitidas |
| Adaptive Thinking Eficiencia de razonamiento | Disponible | Menos tokens desperdiciados |
| Calibración de esfuerzo Por nivel de effort | Línea base | Más fiable en cada dominio |
| Effort Control en la UI claude.ai · Cowork | — | ★ Nuevo |
| Dynamic Workflows Subagentes en Claude Code | — | ★ Nuevo |
| Fast Mode Tokens por segundo | — | 2.5× · 3× más barato ★ Nuevo |
| Mensajes de sistema a mitad de conversación | — | ✓ Soportado |
| Mínimo de prompt cache | Mayor | 1,024 tokens |
| Alineación y seguridad | Línea base | Comportamiento desalineado mucho menor |
| Ventana de contexto | 1M tokens | 1M tokens igual |
| Salida máxima | 128k tokens | 128k tokens igual |
| Precio input / output | $5 / $25 por M | $5 / $25 por M sin cambios |
Opus 4.8 se lanza al mismo precio estándar que Opus 4.7. Identificador de API: claude-opus-4-8.
Para razonamiento de máxima calidad, programación agéntica y trabajo de alta autonomía.
El mismo modelo con hasta 2.5× más tokens por segundo. Research preview en la Claude API.
Disponible hoy en la Claude API, Claude Code, claude.ai, Amazon Bedrock y Google Vertex AI.
Modelo: claude-opus-4-8 · Contexto 1M · Salida 128k