OpenAI afirma que su nuevo modelo alcanzó nivel humano en una prueba de “inteligencia general”. ¿Qué significa eso?
El sistema o3 de OpenAI alcanzó una puntuación de 85% para la prueba ARC-AGI, bastante por encima del 55% anterior, y a la par del puntaje humano promedio.