Las nuevas capacidades multimodales de o3 y o4-mini son impresionantes, como demuestra la habilidad del primero para geolocalizar una foto que le indiquemos. Para OpenAI no parece ser suficiente, pues un par de meses después de su lanzamiento han lanzado o3-pro, a la espera de una nueva generación razonadora.
Si o3 se basó en integrar más herramientas en la cadena de pensamiento de su función razonadora, con o3-pro potencian esa dirección, destacando en pruebas con examinadores humanos. En ellas, un 64,9% prefirieron o3-pro frente a o3 en análisis científico, un 66,7% en escritura personal, un 62,7% en programación y un 64,3% en análisis de datos.
Hay que recordar que todas estas cifras son compartidas por OpenAI, por lo que habrá que esperar a análisis externos, pero de momento, siempre guardan relación con la realidad una vez el modelo está lanzado (no así en o3 y en Sora cuando fueron mostrados por primera vez, pues prometieron cifras más altas y vídeos de más calidad que los que luego lograron en el modelo comercial). Para mejorar los resultados de o3, OpenAI ha recurrido a una etapa extra de entrenamiento por refuerzo
o3 Pro llega sin compararse directamtente con Gemini 2.5 Pro
Porcentajes de victoria de o3 pro sobre el o3 estándar
En el sentido de lo que hablábamos, o3 Pro ha llegado prometiendo saltos importantes respecto a o3. Desde OpenAI citan un mejora de tres puntos porcentuales en la prueba de matemáticas AIME 2024 …