OpenAI Presenta los Nuevos Modelos de Razonamiento o3 y o3-mini

OpenAI ha comenzado a invitar a un grupo selecto de usuarios a probar sus nuevos modelos avanzados de razonamiento, denominados o3 y o3-mini. Estos modelos, sucesores de los populares o1 y o1-mini lanzados a principios de mes, representan el siguiente paso en el desarrollo de inteligencia artificial de alto rendimiento.

¿Qué es el modelo OpenAI o3?


El modelo o3 debe su nombre a una estrategia de marca única y al deseo de evitar conflictos de derechos de autor con la empresa de telecomunicaciones O2. Según el CEO de OpenAI, Sam Altman, «nuestra tradición es ser malos para nombrar cosas». El anuncio oficial se realizó durante el evento de cierre de los «12 días de OpenAI».

Lanzamiento Programado para 2025


OpenAI ha comunicado que los modelos o3 y o3-mini estarán inicialmente disponibles para investigadores seleccionados, quienes se encargarán de realizar pruebas exhaustivas de seguridad. Se espera que o3-mini esté listo para finales de enero de 2025, mientras que el modelo o3 completo verá la luz poco después.

«Estos modelos inauguran una nueva fase en la IA, capaces de realizar tareas complejas que exigen un razonamiento sofisticado», comentó Altman.

Competencia Feroz con Google


Este anuncio coincide con la reciente presentación de Gemini 2.0 Flash Thinking por parte de Google, un modelo competidor que documenta los pasos de su proceso de razonamiento. La rivalidad entre OpenAI y Google, así como otros actores clave en el campo de la IA, se intensifica con la introducción de modelos diseñados para aplicaciones avanzadas en áreas como ciencias, matemáticas y tecnología.

Rendimiento Superior en Pruebas


OpenAI ha compartido resultados sobresalientes para o3 en una variedad de pruebas de referencia:

  • Codificación excepcional: Mejora el rendimiento de o1 en 22,8 puntos porcentuales en SWE-Bench Verified y alcanza una calificación de 2727 en Codeforces.
  • Dominio en matemáticas y ciencias: Logra un 96,7% en el examen AIME 2024 y un 87,7% en GPQA Diamond, superando ampliamente a los expertos humanos.
  • Pruebas conceptuales avanzadas: o3 establece nuevos récords en benchmarks como Frontier Math y ARC-AGI, resolviendo problemas que otros modelos no logran superar.

Innovaciones en Seguridad: Alineación Deliberativa


OpenAI ha desarrollado un enfoque innovador conocido como alineación deliberativa, que integra especificaciones de seguridad directamente en los modelos. Esto permite a los modelos razonar sobre estas políticas antes de generar respuestas, reduciendo errores y mejorando la confiabilidad.

Este enfoque mejora significativamente métodos anteriores como el aprendizaje por refuerzo con retroalimentación humana (RLHF), asegurando que los modelos sean más seguros y adaptables en entornos desafiantes.

Solicitud de Acceso a los Modelos o3 y o3-mini


OpenAI ya ha abierto el proceso de solicitudes para acceso temprano a estos modelos. Los interesados deben completar un formulario online antes del 10 de enero de 2025, proporcionando detalles sobre su experiencia y objetivos de investigación.

Los seleccionados podrán explorar las capacidades de o3 y o3-mini, contribuyendo a evaluaciones de seguridad y demostraciones controladas de alto impacto.