OpenAI acaba de presentar su esperado nuevo modelo, bautizado sencillamente como "o1", aunque también era ya conocido de forma coloquial como el "modelo Strawberry". Y desembarca con la promesa de abordar problemas más complejos que sus antecesores, haciendo gala de una capacidad de razonamiento avanzada.
De hecho, este modelo es el primero de una nueva serie de modelos de inteligencia artificial entrenados para simular un proceso de pensamiento similar al humano, lo que constituye un hito significativo en la evolución de los grandes modelos de lenguaje (LLMs, por sus siglas en inglés).
¿Qué ofrece el modelo o1?
A diferencia de sus predecesores, como GPT-4o, o1 ha sido entrenado utilizando un enfoque innovador basado en el aprendizaje por refuerzo, una técnica en la que el sistema aprende a resolver problemas recibiendo recompensas y penalizaciones por sus acciones.
Según Noam Brown, investigador de OpenAI, lo que diferencia a o1 de otros modelos es su capacidad de 'pensar' antes de responder. Este proceso de razonamiento, denominado 'cadena de pensamientos', le permite procesar consultas complejas de manera más efectiva, a medida que simula pasos intermedios para llegar a una solución.
En Genbeta
Así quiere evitar OpenAI las "alucinaciones" de ChatGPT: acercándose más al pensamiento humano
Gracia a eso, cuenta con capacidad para resolver problemas más complejos, como tareas de programación y matemáticas avanzadas, con una precisión considerablemente mayor que sus predecesores...
...en pruebas realizadas por OpenAI, o1 demostró su …