No hay sitio en el mercado para todas las IAs que están naciendo. 2026 va a ser el año en el que las mejores se harán fuertes y serán las que capten la atención de la gente, mientras que las «peores» tendrán que cambiar radicalmente o estarán condenadas a desaparecer. Y en plena guerra de modelos, el objetivo ya no va por ver quién razone más, como sí ha ocurrido en 2025, sino por ver quién ofrece mayor rendimiento por menos dinero. Y, el nuevo Claude Sonnet 4.6, se lo ha puesto muy difícil a sus rivales.
Hace unas horas, Anthropic ha anunciado el lanzamiento de la nueva versión de «Sonnet», su modelo de lenguaje intermedio. Esta nueva versión se trata de una actualización muy importante del modelo, la cual recorta mucho la distancia con Opus, su modelo de gama alta, en tareas como la programación, el razonamiento, la planificación de agentes, el trabajo de oficina y en la capacidad de usar un ordenador como lo haría una persona.
Características de Sonnet 4.6
La principal característica del nuevo Sonnet 4.6 es que se convierte en el modelo por defecto de Claude. Al hacerlo, el free tier incluye ahora creación de archivos, conectores, skills y compaction. En otras palabras, los usuarios que utilicen el plan gratuito de Claude no solo tendrán una IA que responda un poco mejor, sino que ganan a mayores más herramientas prácticas para flujos de trabajo reales.
Anthropic también destaca una serie de mejoras pensadas para mejorar el funcionamiento en sesiones largas de programación. Por ejemplo, en varias pruebas realizadas en Claude Code, los resultados han mostrado que los usuarios preferían el nuevo Sonnet 4.6 frente a la versión 4.5 con bastante diferencia, ya que el modelo tiende menos a «liarse» duplicando lógica o saltándose contexto. Además, este modelo incluye también:
- Context compaction (beta): una función que resume contexto antiguo al acercarnos a los límites para estirar la conversación.
- Herramientas de web search y fetch que nos permiten filtrar resultados de forma mucho más eficiente.
- Capacidades adicionales, como code execution o memory, que ahora pasan a estar disponibles de forma general.
- Claude en Excel ahora cuenta con conectores MCP en ciertos planes (Pro/Max/Team/Enterprise), lo que nos permite acceder a fuentes externas sin salir de la hoja de cálculo.
Otra de las características de este modelo es su ventana de contexto. Anthropic ha trabajado para que este modelo sea capaz de usar un contexto de 200k tokens por defecto, ampliando hasta 1 millón en fase beta. Esto lo convierte en uno de los más grandes de todo el mercado, siendo capaz de procesar bases de código enteras, contratos muy largos o montones de documentos en una sola petición. Eso sí, el modo de 1 millón de contexto no es para todo el mundo y, por ahora, solo queda como beta para organizaciones con ciertos niveles de uso o tarifas.
Sobre la seguridad, que un modelo pueda «usar un ordenador» abre una puerta enorme a la automatización… y también a nuevos riesgos. Anthropic reconoce el problema de la prompt injection (instrucciones maliciosas camufladas para desviar al modelo) que hay escondidas en muchas webs, aunque afirma haber mejorado la resistencia frente a este vector de ataque en Sonnet 4.6 frente a Sonnet 4.5. También, en la System Card, se describe que, en determinados escenarios de «computer use» con interfaz gráfica, Sonnet 4.6 puede tirar más de atajos o soluciones no autorizadas cuando una tarea es imposible o está rota (es lo que se conoce como over-eagerness). Aunque ahora esto es más detectable y dirigible, hay que tenerlo también en cuenta. Por ello, si vamos a automatizar tareas reales (formularios, navegación, acciones con impacto), la supervisión y los límites importan más que nunca.
En cuanto al rendimiento de este nuevo modelo de lenguaje, Anthropic no ha querido quedarse solo en promesas vacías, sino que ha publicado en la documentación los resultados de los dos principales tests a los que se suele enfrentar a las IAs:
- 79,6% en SWE-bench Verified: una prueba estandarizada que evalúa la capacidad del modelo para resolver problemas reales de ingeniería de software extraídos de repositorios de GitHub.
72,5% en OSWorld-Verified: un benchmark que mide la habilidad para ejecutar tareas complejas en un entorno de escritorio simulado, demostrando su aptitud para la automatización de procesos.
Pero, además de todo lo anterior, lo más importante para la mayoría de usuarios es que el nuevo Sonnet 4.6 pasa a ser el modelo por defecto en claude.ai, tanto para el plan gratis como para el Pro. Esto quiere decir que, aunque no paguemos, desde hoy vamos a poder empezar a usar este «modelo nuevo». En su uso por API, Anthropic lo vende con el mismo precio que Sonnet 4.5, es decir, 3 / 15 dólares por millón de tokens (entrada / salida). Eso sí, si activamos el modo de 1M y superamos ciertos umbrales de entrada, aparecen tarifas prémium para «long context».
Cómo probar el nuevo Claude hoy mismo
El nuevo modelo Sonnet 4.6 de Claude ya está disponible para todos los usuarios a partir de hoy. Para empezar a usarlo, no tenemos más que entrar en la web de la IA, claude.ai, donde ya nos aparecerá este nuevo modelo por defecto para empezar a usarlo. Si usamos Claude Cowork, o la API de esta IA, también tendremos ya este nuevo modelo disponible para utilizarlo. Si somos usuarios de Perplexity, también vamos a poder usar el nuevo Claude Sonnet 4.6 desde su IA, ya que ya está disponible en esta herramienta.
Con Claude Sonnet 4.6, Anthropic parece apostar por una idea muy clara: hacer que el modelo «calidad-precio» sea el que realmente compita arriba. Y no solo como una alternativa barata, sino como un modelo TOP que lleve la programación, el computer use y el contexto largo a todos los usuarios.
