OpenAI ha presentado su nueva familia de modelos de lenguaje: GPT-4.1, GPT-4.1 Mini y GPT-4.1 Nano. Aunque se anuncian como una evolución significativa respecto a sus predecesores con una ventana de contexto de hasta un millón de tokens y centrada especialmente en programación, lo cierto es que no han conseguido superar a la competencia directa, especialmente a Gemini 2.5 Pro de Google, que continúa liderando los principales benchmarks.
Este lanzamiento supone un punto de inflexión para OpenAI. Tal y como señala el investigador en IA Pierre Bongrand, es la primera vez que la compañía lanza un modelo tras Google y se queda muy por detrás en rendimiento. Además, este lanzamiento viene acompañado de cierta inestabilidad en la estrategia de producto, con la retirada inminente de GPT-4.5, modelo que se había presentado con gran expectación y que desaparecerá de ChatGPT el 30 de abril.
Gemini 2.5 Pro sigue liderando los ránkings
Los benchmarks publicados tras el anuncio han dejado clara la superioridad de Gemini 2.5 Pro. En particular, en el test GPQa, diseñado para evaluar el razonamiento en tareas de nivel posgrado, Gemini se posiciona a la cabeza, muy por delante de GPT-4-1, y que ha quedado evidenciado en la gráfica publicada por Bongrand en sus redes sociales.
Pulsa en la imagen para acceder a la publicación.
Lo más preocupante para OpenAI es que, pese a tener precios similares por millón de tokens, el rendimiento de GPT-4.1 está muy por debajo. …