OpenAI y Anthropic presentaron nuevos modelos de inteligencia artificial en sus respectivas líneas de productos, aproximadamente una hora uno tras otro el pasado jueves. Este evento resalta la creciente competencia entre los principales desarrolladores por dominar el software empresarial y las herramientas de codificación avanzadas.
Anthropic dio a conocer Claude Opus 4.6, destacando mejoras en el razonamiento a largo plazo y en flujos de trabajo basados en agentes, mientras que OpenAI lanzó poco después GPT-5.3 Codex, un modelo optimizado para la codificación y el desarrollo de software.
Estos lanzamientos casi simultáneos subrayan la rapidez con la que los rivales están iterando, mientras las empresas compiten por asegurar contratos a largo plazo con grandes clientes corporativos.
Los resultados de referencia sugirieron que ambos modelos están optimizados para diferentes fortalezas.
Claude Opus 4.6 mostró un rendimiento superior en tareas relacionadas con el razonamiento legal y financiero, mientras que GPT-5.3 Codex superó las pruebas de codificación y métricas de eficiencia, según los datos proporcionados por ambas compañías.
Estos lanzamientos se producen en un momento en que los inversores están reevaluando las perspectivas de los proveedores de software tradicionales, ya que las acciones de varias empresas de información y servicios profesionales han caído esta semana
entre preocupaciones
de que las plataformas nativas de IA puedan erosionar la demanda de herramientas empresariales establecidas.
Anthropic
aseguró
que Claude Opus 4.6 logra mejoras en el razonamiento a largo plazo y en tareas profesionales, citando una ventana de contexto de un millón de tokens y un puntaje del 76% en MRCR v2, un referente para la recuperación de información compleja.
La compañía también afirmó que el modelo superó versiones anteriores en tareas financieras y legales, e introdujo «equipos de agentes» que permiten a múltiples agentes de IA trabajar en paralelo en codificación y documentación.
OpenAI
lanzó
GPT-5.3 Codex poco después, posicionándolo como un modelo optimizado para la codificación y la investigación autónoma.
OpenAI indicó que Codex obtuvo un 77.3% en Terminal-Bench 2.0, un referente de codificación, donde Claude Opus 4.6 logró un 65.4%, completando tareas más rápido y utilizando menos tokens.
Además, OpenAI destacó que versiones tempranas de Codex se utilizaron internamente para ayudar a depurar el entrenamiento y gestionar la implementación, marcando una de las primeras ocasiones en las que un modelo desempeñó un papel directo en acelerar su propio desarrollo.
En conjunto, los resultados sugieren que ninguno de los modelos tiene una ventaja clara en términos generales, ya que las ventajas de rendimiento dependen de si las empresas priorizan el razonamiento profesional o el desarrollo autónomo de software.
Se espera que Google también lance actualizaciones a sus modelos Gemini en los próximos meses, mientras que otros desarrolladores de IA, incluidos DeepSeek, se preparan para nuevos lanzamientos, sumando velocidad a la competencia en el sector.
Sin embargo, los resultados de referencia por sí solos son poco probables que determinen el liderazgo en el mercado, ya que la adopción más amplia y la implementación en empresas moldean cada vez más el panorama competitivo.
A medida que la competencia continúa presionando a los rivales, el tiempo dirá si los flujos de trabajo basados en agentes se convierten en un componente central de la actividad económica. OpenAI y Anthropic definitivamente apuestan por ello.
Boletín Diario
Inicia cada día con las principales historias de noticias del momento, además de características originales, un podcast, videos y más.
Fuente: decrypt.co