Nuevo · 28 de mayo de 2026 · Disponible hoy

Claude Opus 4.8

El modelo más capaz y honesto de Anthropic hasta la fecha. Razonamiento profundo, programación agéntica de largo alcance y trabajo de alta autonomía — con una nueva clase de fiabilidad.

69.2%
SWE-Bench Pro
1M
tokens de contexto
2.5×
más rápido (Fast Mode)
4×
más honesto que 4.7
Novedades

Todo lo nuevo en Opus 4.8

Nuevas capacidades de agente, controles para desarrolladores y un salto en honestidad y alineación — todo disponible desde el primer día.

Dynamic Workflows

Claude genera un plan, despliega cientos de subagentes en paralelo y verifica los resultados antes de reportar. Migraciones a escala de cientos de miles de líneas en Claude Code.

Research preview

Effort Control

Un nuevo control junto al selector de modelo en claude.ai y Cowork. Elige cuánto esfuerzo dedica Claude: más profundidad o más velocidad. Por defecto, esfuerzo high.

claude.ai · Cowork

Fast Mode

Hasta 2.5× más tokens de salida por segundo desde el mismo modelo. Y ahora tres veces más barato que en modelos anteriores. Disponible como research preview en la Claude API.

2.5× velocidad

Ventana de 1M tokens

Contexto de 1 millón de tokens por defecto en la Claude API, Amazon Bedrock y Vertex AI, con hasta 128k tokens de salida. Conversaciones y bases de código enteras en una sola sesión.

128k de salida

Adaptive Thinking

Razona solo cuando el turno lo requiere: responde directo en consultas simples y reflexiona en problemas complejos. Menos tokens de pensamiento desperdiciados que en Opus 4.7.

Calibrado por turno

Mensajes de sistema a mitad de conversación

Inserta instrucciones role: "system" en cualquier punto del bucle agéntico sin reescribir el prompt completo — preservando los aciertos de prompt cache y reduciendo el coste.

Sin beta header

El modelo más honesto

4× menos probable que Opus 4.7 de dejar pasar fallos en su propio código sin señalarlos. Más propenso a admitir incertidumbre y menos a afirmar progreso sin evidencia suficiente.

Alineación ~Mythos

Mejor uso de herramientas

Menos casos de omitir una llamada a herramienta que la tarea requería — uno de los puntos que algunos usuarios reportaron en Opus 4.7. Comportamiento agéntico más fiable de extremo a extremo.

Menos omisiones

Cache mínimo más bajo

El mínimo de prompt cacheable baja a 1,024 tokens. Prompts que eran demasiado cortos para cachear en Opus 4.7 ahora crean entradas de cache sin cambios de código.

1,024 tokens
Rendimiento

Récords en los benchmarks que importan

Opus 4.8 supera a Opus 4.7 y a GPT-5.5 en programación agéntica, uso de computadora y navegación autónoma.

Claude Opus 4.8 Claude Opus 4.7 GPT-5.5

SWE-Bench Pro

Programación agéntica del mundo real

Opus 4.8
69.2%
Opus 4.7
64.3%
GPT-5.5
58.6%

OSWorld-Verified

Uso de computadora agéntico

Opus 4.8
83.4%
Opus 4.7
82.8%

Online-Mind2Web

Agente de navegador · el más fuerte probado por Anthropic

Opus 4.8
84%
Opus 4.7
76%
GPT-5.5
71%

Además: única IA en completar todos los casos del benchmark Super-Agent de extremo a extremo, y la puntuación más alta registrada en el Legal Agent Benchmark — primera en superar el 10 % en el estándar all-pass.

Opus 4.8 vs Opus 4.7

Qué cambia frente a Opus 4.7

Mismo precio, misma ventana de contexto — y una mejora medible en casi todas las dimensiones que importan para el trabajo agéntico.

Dimensión Opus 4.7El estándar anterior Opus 4.8El nuevo flagship
SWE-Bench Pro Programación agéntica 64.3 % 69.2 % ▲ +4.9 pts
OSWorld-Verified Uso de computadora 82.8 % 83.4 % ▲ mejor
Online-Mind2Web Agente de navegador ~76 % 84 % ▲ el más fuerte
Honestidad en código Fallos sin señalar Línea base 4× menos probable ▲ honestidad
Contexto largo Trazas agénticas largas Más compactaciones Menos compactaciones, mejor recuperación
Uso de herramientas Tool triggering Omisiones reportadas Menos llamadas omitidas
Adaptive Thinking Eficiencia de razonamiento Disponible Menos tokens desperdiciados
Calibración de esfuerzo Por nivel de effort Línea base Más fiable en cada dominio
Effort Control en la UI claude.ai · Cowork ★ Nuevo
Dynamic Workflows Subagentes en Claude Code ★ Nuevo
Fast Mode Tokens por segundo 2.5× · 3× más barato ★ Nuevo
Mensajes de sistema a mitad de conversación Soportado
Mínimo de prompt cache Mayor 1,024 tokens
Alineación y seguridad Línea base Comportamiento desalineado mucho menor
Ventana de contexto 1M tokens 1M tokens igual
Salida máxima 128k tokens 128k tokens igual
Precio input / output $5 / $25 por M $5 / $25 por M sin cambios
Precios

Más capacidad, mismo precio

Opus 4.8 se lanza al mismo precio estándar que Opus 4.7. Identificador de API: claude-opus-4-8.

Estándar

Para razonamiento de máxima calidad, programación agéntica y trabajo de alta autonomía.

Tokens de entrada$5 / millón
Tokens de salida$25 / millón
2.5× velocidad
Fast Mode

El mismo modelo con hasta 2.5× más tokens por segundo. Research preview en la Claude API.

Tokens de entrada$10 / millón
Tokens de salida$50 / millón

Empieza a construir con Opus 4.8

Disponible hoy en la Claude API, Claude Code, claude.ai, Amazon Bedrock y Google Vertex AI.

Modelo: claude-opus-4-8 · Contexto 1M · Salida 128k