Claude Opus 4.8

Novedades

Todo lo nuevo en Opus 4.8

Nuevas capacidades de agente, controles para desarrolladores y un salto en honestidad y alineación — todo disponible desde el primer día.

Dynamic Workflows

Claude genera un plan, despliega cientos de subagentes en paralelo y verifica los resultados antes de reportar. Migraciones a escala de cientos de miles de líneas en Claude Code.

Research preview

Effort Control

Un nuevo control junto al selector de modelo en claude.ai y Cowork. Elige cuánto esfuerzo dedica Claude: más profundidad o más velocidad. Por defecto, esfuerzo high.

claude.ai · Cowork

Fast Mode

Hasta 2.5× más tokens de salida por segundo desde el mismo modelo. Y ahora tres veces más barato que en modelos anteriores. Disponible como research preview en la Claude API.

2.5× velocidad

Ventana de 1M tokens

Contexto de 1 millón de tokens por defecto en la Claude API, Amazon Bedrock y Vertex AI, con hasta 128k tokens de salida. Conversaciones y bases de código enteras en una sola sesión.

128k de salida

Adaptive Thinking

Razona solo cuando el turno lo requiere: responde directo en consultas simples y reflexiona en problemas complejos. Menos tokens de pensamiento desperdiciados que en Opus 4.7.

Calibrado por turno

Mensajes de sistema a mitad de conversación

Inserta instrucciones role: "system" en cualquier punto del bucle agéntico sin reescribir el prompt completo — preservando los aciertos de prompt cache y reduciendo el coste.

Sin beta header

El modelo más honesto

4× menos probable que Opus 4.7 de dejar pasar fallos en su propio código sin señalarlos. Más propenso a admitir incertidumbre y menos a afirmar progreso sin evidencia suficiente.

Alineación ~Mythos

Mejor uso de herramientas

Menos casos de omitir una llamada a herramienta que la tarea requería — uno de los puntos que algunos usuarios reportaron en Opus 4.7. Comportamiento agéntico más fiable de extremo a extremo.

Menos omisiones

Cache mínimo más bajo

El mínimo de prompt cacheable baja a 1,024 tokens. Prompts que eran demasiado cortos para cachear en Opus 4.7 ahora crean entradas de cache sin cambios de código.

1,024 tokens

Rendimiento

Récords en los benchmarks que importan

Opus 4.8 supera a Opus 4.7 y a GPT-5.5 en programación agéntica, uso de computadora y navegación autónoma.

Claude Opus 4.8 Claude Opus 4.7 GPT-5.5

SWE-Bench Pro

Programación agéntica del mundo real

Opus 4.8

69.2%

Opus 4.7

64.3%

GPT-5.5

58.6%

OSWorld-Verified

Uso de computadora agéntico

Opus 4.8

83.4%

Opus 4.7

82.8%

Online-Mind2Web

Agente de navegador · el más fuerte probado por Anthropic

Opus 4.8

84%

Opus 4.7

76%

GPT-5.5

71%

Además: única IA en completar todos los casos del benchmark Super-Agent de extremo a extremo, y la puntuación más alta registrada en el Legal Agent Benchmark — primera en superar el 10 % en el estándar all-pass.

Opus 4.8 vs Opus 4.7

Qué cambia frente a Opus 4.7

Mismo precio, misma ventana de contexto — y una mejora medible en casi todas las dimensiones que importan para el trabajo agéntico.

Dimensión	Opus 4.7El estándar anterior	Opus 4.8El nuevo flagship
SWE-Bench Pro Programación agéntica	64.3 %	69.2 % ▲ +4.9 pts
OSWorld-Verified Uso de computadora	82.8 %	83.4 % ▲ mejor
Online-Mind2Web Agente de navegador	~76 %	84 % ▲ el más fuerte
Honestidad en código Fallos sin señalar	Línea base	4× menos probable ▲ honestidad
Contexto largo Trazas agénticas largas	Más compactaciones	Menos compactaciones, mejor recuperación
Uso de herramientas Tool triggering	Omisiones reportadas	Menos llamadas omitidas
Adaptive Thinking Eficiencia de razonamiento	Disponible	Menos tokens desperdiciados
Calibración de esfuerzo Por nivel de effort	Línea base	Más fiable en cada dominio
Effort Control en la UI claude.ai · Cowork	—	★ Nuevo
Dynamic Workflows Subagentes en Claude Code	—	★ Nuevo
Fast Mode Tokens por segundo	—	2.5× · 3× más barato ★ Nuevo
Mensajes de sistema a mitad de conversación	—	✓ Soportado
Mínimo de prompt cache	Mayor	1,024 tokens
Alineación y seguridad	Línea base	Comportamiento desalineado mucho menor
Ventana de contexto	1M tokens	1M tokens igual
Salida máxima	128k tokens	128k tokens igual
Precio input / output	$5 / $25 por M	$5 / $25 por M sin cambios

Precios

Más capacidad, mismo precio

Opus 4.8 se lanza al mismo precio estándar que Opus 4.7. Identificador de API: claude-opus-4-8.

Estándar

Para razonamiento de máxima calidad, programación agéntica y trabajo de alta autonomía.

Tokens de entrada$5 / millón

Tokens de salida$25 / millón

2.5× velocidad

Fast Mode

El mismo modelo con hasta 2.5× más tokens por segundo. Research preview en la Claude API.

Tokens de entrada$10 / millón

Tokens de salida$50 / millón

Todo lo nuevo en Opus 4.8

Dynamic Workflows

Effort Control

Fast Mode

Ventana de 1M tokens

Adaptive Thinking

Mensajes de sistema a mitad de conversación

El modelo más honesto

Mejor uso de herramientas

Cache mínimo más bajo

Récords en los benchmarks que importan

SWE-Bench Pro

OSWorld-Verified

Online-Mind2Web

Qué cambia frente a Opus 4.7

Más capacidad, mismo precio

Empieza a construir con Opus 4.8