InicioCiencia & TecnologíaClaude 4.8 Opus: lista de novedades de la nueva versión del modelo...

Claude 4.8 Opus: lista de novedades de la nueva versión del modelo de Inteligencia Artificial de Anthropic

Claude 4.8 Opus: lista de novedades de la nueva versión del modelo de Inteligencia Artificial de Anthropic

Vamos a decirte cuáles son las novedades de Claude 4.8 Opus, la nueva versión del modelo de inteligencia artificial más avanzado y potente de Anthropic. Esta versión ha sorprendido por llegar apenas 41 días después de Claude Opus 4.7, y parece que las mejoras son mínimas, pero hay un cambio realmente importante en su honestidad a la hora de decirte si no sabe algo.

En cualquier caso, aquí tienes una lista completa con todas las novedades que llegan con esta nueva versión de Claude 4.8 Opus. Cada una de ellas te las vamos a explicar brevemente para que sean fáciles de entender.

Otra cosas que debes saber es que Opus es la línea de modelos de Claude más avanzada, la indicada para tareas más complejas para la programación y la que más rápido te gasta los límites cuando lo usas. También existen el modelo Sonnet más eficiente para tareas del día a día, que sigue en su versión 4.6 desde febrero de 2026, y un Haiku para preguntas rápidas y sencillas que sigue en su versión 4.5 desde octubre del 2025.

Novedades de Claude 4.8 Opus

Claude

  • Una IA más honesta: El protagonismo de esta nueva versión se lo lleva la honestidad. Es significativamente más honesto sobre su propio trabajo, diciéndote cuándo no está seguro de algo. También es aproximadamente cuatro veces menos probable que deje pasar errores en código sin señalarlos, en comparación con su predecesor.
  • Mejoras de rendimiento: La puntuación Agentic code para crear código con agentes sube de 64.3% a 69.2%, y el razonamiento multidisciplinar con herramientas pasa de 54.7% a 57.9%. En otros bancos de prueba, en el SWE-bench Verified pasa de 87.6% (Opus 4.7) a 88.6%, y en Terminal-Bench 2.1 sube de 66.1% a 74.6%. GPT-5.5 sigue quedándose por arroba en los flujos de trabajo de terminal/CLI, aunque ha habido grandes mejoras en Claude, y ambos modelos están prácticamente a la par en la navegación web y en temas científicos de nivel de posgrado.
  • Mejoras en el alineamiento: Las evaluaciones de alineamiento muestran nuevos máximos en rasgos prosociales como apoyar la autonomía del usuario y actuar en su mejor interés. Las tasas de comportamiento desalineado como el engaño son menores que en Opus 4.7. 
  • Menos alucinaciones: Como suele ser habitual, también se reduce la cantidad de alucinaciones. La honestidad a la hora de decirte cuándo no sabe una cosa también ayuda a reducirlas.
  • Modo rápido: Según Anthropic, el modo rápido de Opus 4.8 es ahora aproximadamente 2,5 veces más rápido. La empresa afirma que el modo rápido mejorado también cuesta tres veces menos que antes. 
  • Control de esfuerzo: los usuarios pueden elegir entre niveles «extra» o «max» para que el modelo gaste más tokens y obtenga mejores resultados.
  • Dynamic Workflows (preview para investigación): Con esta nueva función, Claude puede planificar trabajo y ejecutar cientos de subagentes en paralelo en una sola sesión, siendo capaz de completar migraciones a escala de base de código de cientos de miles de líneas. Disponible para Claude Code en planes Enterprise, Team y Max.
  • Sin cambio en el precio base: El precio base de los tokens de la API no cambia con respecto a Opus 4.7. Es de 5 dólares por millón de tokens de entrada, y 25 dólares por millón de salida, con hasta un 90% de ahorro con prompt caching y un 50% con batch processing. 

En Xataka Basics | Cómo evitar que la IA te de siempre la razón por defecto y así conseguir que Claude, Gemini y ChatGPT tengan menos alucinaciones


La noticia

Claude 4.8 Opus: lista de novedades de la nueva versión del modelo de Inteligencia Artificial de Anthropic

fue publicada originalmente en

Xataka

por

Yúbal Fernández

.

Fuente: www.xataka.com

RELATED ARTICLES
- Advertisment -
Google search engine
Google search engine
Google search engine

Most Popular