Cursor ha presentado Composer 2.5, un modelo de IA generativa específicamente destinado a una cosa: programar bien. ¿Cómo de bien? Pues según esta startup, lo hace tan bien como los mejores modelos del momento, Claude Opus 4.7 y GPT 5.5, pero además lo hace por un coste inferior. El desafío es llamativo no ya por lo que supone para Cursor, sino por cómo han creado ese modelo: resulta que se basa en un modelo de IA chino.
Modelos de IA especializados en una cosa. Mientras OpenAI y Anthropic tratan de desarrollar modelos de propósito general —hacen muchas cosas realmente bien—, Cursor ha decidido centrarse en una tarea específica. La startup de IA ha creado un modelo de IA especializado en programar, y lo ha hecho defendiendo que no son necesarios un billón de parámetros para competir con los mejores. Dedicarse a una sola cosa permite no solo ganar en eficiencia, sino también en costes. Esto no es un decatleta, sino un especialista en la prueba de 200 m, por decirlo de algún modo.

¿Tan bueno como GPT-5.5 o Claude Opus 4.7? Eso afirman en Cursor, porque según sus pruebas con varios benchmarks específicos de programación, el rendimiento está a la altura de esos dos modelos que a día de hoy son los grandes referentes tanto en programación como en otros ámbitos.

Y bastante más barato. Esos resultados son además especialmente interesantes cuando les añadimos el factor coste. El coste medio por tarea en el benchmark CursorBench 3.1 demostró que Composer 2.5 lograba resolver casi el 65% de todas las pruebas con un coste de apenas 0,3 dólares. Opus 4.7 max y GPT-5.5 xhigh lograban llegar a ese 65%, pero a costes muy superiores: algo más de 4 dólares en el caso de GPT, y 11 dólares en el caso de Opus. La diferencia es abismal. El precio de acceso a la API demuestra las diferencias: 0,5 dólares por millón de tokens de entrada 2,5 dólares por millón de tokens de salida, cuando el de Claude Opus 4.7 es de 5/25 y el de GPT-5.5 es de 5/30 respectivamente.
Retroalimentación textual. A diferencia de los modelos que solo aprenden del resultado final, Composer 2.5 ha sido entrenado con una técnica de aprendizaje por refuerzo (Reinforcement Learning) que permite ofrecer pistas sobre qué está pasando si se están cometiendo errores. Eso permite al modelo recalibrarse y actuar como un profesor transparente. Uno que además que corrige palabra por palabra a medida que va resolviendo el ejercicio, no solo al ver el resultado final. El 85% del presupuesto de entrenamiento se ha dedicado exclusivamente al aprendizaje por refuerzo, calibrando el modelo no para charlar, sino para ejecutar refactorizaciones de código o corregir errores en tiempo real.
Un modelo «nacido» en China. Los propios responsables de Cursor han explicado que Composer 2.5 —como su antecesor, Composer 2, lanzado a finales de marzo— es un modelo derivado de Kimi K2.5, el modelo de IA de la startup china Moonshot. Aunque esa es la base, ya en Composer 2 las tareas de entrenamiento y post-entrenamiento logran mejorar el comportamiento de forma muy notable en benchmarks de programación y también en otros como Terminal Bench que evalúan el comportamiento agéntico de estos modelos.
Cursor se hace mayor. Esta startup se hizo famosa por crear un agente de IA de programación que fue pionero en esa fiebre que vivimos por el vibecoding. La experiencia de usuario no es ya la de programar, como en los IDEs (Integrated Development Environtments) tradicionales, sino la de dirigir a la máquina para que programe ella por ti. Composer 2.5 no solo programa: entiende la estructura y las relaciones entre archivos, y convierte a Cursor en una empresa de IA mucho más competitiva, porque ya no depende de poder funcionar con modelos de Anthropic o de OpenAI, por ejemplo. Tener tanto el agente de IA como el modelo que procesa todo lo convierte en una solución mucho más competitiva.
Elon Musk tiene a Cursor en el punto de mira. La buena marcha de Cursor ha hecho que haya surgido un creciente interés por comprar esta empresa antes incluso de que sea demasiado grande. Elon Musk lo sabe bien y Grok, el modelo de xAI, no es tan popular en el ámbito de la programación. En abril supimos que SpaceX había llegado a un acuerdo que le da opción a comprar Cursor por 60.000 millones de dólares. Sería un acuerdo prometedor para ambas, porque Composer 2.5 ya ha usado la infraestructura de Colossus para entrenarse, y xAI podría así tratar de ganar cuota de mercado en el jugoso sector empresarial.
–
La noticia
Hay una batalla por tener el modelo de IA que programa mejor. Y en ella ha aparecido un rival bueno, bonito y muy barato: Cursor
fue publicada originalmente en
Xataka
por
Javier Pastor
.
Fuente: www.xataka.com







