Resumen
- OpenAI lanzó GPT-5.4 en medio del creciente rechazo de QuitGPT por su contrato de IA con el Pentágono.
- GPT-5.4 añade una ventana de contexto de un millón de tokens, un razonamiento más robusto y capacidades ágiles.
- Los usuarios empresariales son los que más se beneficiarán, ya que GPT-5.4 proporciona agentes de IA más rápidos y eficientes.
OpenAI inició el despliegue de GPT-5.4, su modelo más avanzado hasta la fecha, el jueves pasado. Este movimiento llega en un momento crítico, ya que la empresa enfrenta una crisis de relaciones públicas tras la decisión de aproximadamente 2.5 millones de usuarios de cancelar sus suscripciones o unirse a boicots en redes sociales.
El movimiento conocido como QuitGPT tomó fuerza tras el anuncio de OpenAI de un acuerdo con el Departamento de Defensa de EE.UU., justo horas después de que Anthropic, otra empresa de IA, rechazara el mismo contrato. Esta situación llevó a que la firma de Claude recibiera numerosas críticas, incluso del ex-presidente Trump y otros funcionarios gubernamentales.
El principal obstáculo para Anthropic fue la negativa del Departamento de Defensa a incluir cláusulas que prohíban explícitamente el uso de armas autónomas y la vigilancia masiva de los ciudadanos estadounidenses.
A pesar de estas preocupaciones, OpenAI aceptó el acuerdo. Sam Altman, CEO de la compañía, ha enfrentado muchas preguntas sobre la discrepancia aparente entre las salvaguardias de seguridad que su empresa ha proclamado y el lenguaje actual del contrato. Necessita recuperar a esos usuarios.
Así nació GPT-5.4, tan solo dos días después de la presentación de GPT-5.3.
Este nuevo modelo combina capacidades de razonamiento, codificación y funciones ágiles en un solo paquete. Con una capacidad de un millón de tokens en contexto, permite a los usuarios manejar grandes volúmenes de información en una sola sesión.
En términos de rendimiento, los números son alentadores. Según GDPval, un estándar que prueba el trabajo de conocimiento en 44 ocupaciones, GPT-5.4 iguala o supera a los profesionales de la industria en el 83.0% de las comparaciones, un incremento notable desde el 70.9% registrado por GPT-5.2. El uso de computadoras ha dado un salto considerable: en un test de OSWorld-Verified, mientras que GPT-5.2 logró un 47.3%, GPT-5.4 alcanzó un 75.0%, superando así el estándar humano de 72.4%.
En BrowseComp, un test de investigación en la web profunda, el nuevo modelo también mostró un notable avance, superando en 17 puntos porcentuales a GPT-5.2. La ventana de contexto de un millón de tokens y una función de redirección de respuestas permiten a los usuarios ajustar el modelo mientras aún está procesando, optimizando así tanto tiempo como recursos de computación.
¿Quiénes se beneficiarán de GPT-5.4?
Es importante mencionar que algunas comparativas suelen comparar GPT-5.4, a veces con un nivel de razonamiento configurado en esfuerzo extra alto, algo que los usuarios libres y Plus no pueden disfrutar, con GPT-5.2, dejando de lado a GPT-5.3.
Para los usuarios que ya están en GPT-5.3, varios de los beneficios pueden parecer más incrementales de lo que los gráficos sugieren.
Los programadores son quienes deben ajustar sus expectativas: en el benchmark SWE-Bench Pro, la mejora de GPT-5.3-Codex (56.8%) a GPT-5.4 (57.7%) es casi insignificante. El modelo también afirma que se requieren significativamente menos tokens para completar tareas en comparación con GPT-5.2.
«GPT-5.4 es nuestro modelo de razonamiento más eficiente en términos de tokens, utilizando significativamente menos tokens para resolver problemas en comparación con GPT-5.2», declaró OpenAI.
Sin embargo, cualquier mejora en este ámbito es positiva para los desarrolladores que utilizan los modelos de OpenAI a través de su API y son cobrados por cada token consumido. Un modelo con una cadena de pensamiento eficiente podría proporcionar los mismos resultados a un costo menor, en comparación con un modelo que tiende a sobrepensar para alcanzar la conclusión adecuada.
Otro aspecto a considerar para quienes esperan utilizar el nuevo modelo es que, aunque OpenAI anunció el lanzamiento de GPT-5.4, este aún no estaba disponible al momento de redacción. Por lo tanto, es probable que se esté implementando de forma gradual. Para la mayoría de los usuarios, el modelo más efectivo sigue siendo GPT-5.3, que solo puede usarse para respuestas instantáneas, es decir, aquellas que no requieren demasiado esfuerzo.
Los usuarios que dependen del razonamiento extendido—la terminología de OpenAI para el razonamiento complejo—siguen usando GPT-5.2. En otras palabras, los usuarios que probablemente pongan a prueba los límites del modelo son los últimos en recibirlo.

Los usuarios empresariales que realizan trabajos con documentación densa son quienes más se beneficiarán. En un benchmark interno de modelado de hojas de cálculo, GPT-5.4 logró un 87.3% frente al 68.4% de GPT-5.2. La firma de investigación legal Harvey reportó un 91% en su evaluación BigLaw Bench. Además, Mainstay, que utiliza agentes en 30,000 portales de impuestos a la propiedad, informó un 95% de tasa de éxito en el primer intento y que las sesiones se ejecutan «~3 veces más rápido utilizando ~70% menos tokens».
Este tipo de eficiencia es un argumento que puede ser relevante para los equipos de adquisiciones empresariales, sin embargo, es una venta más complicada para el usuario individual que reconsidera si debe eliminar su cuenta.
Boletín Diario
Comienza cada día con las principales noticias del momento, además de características originales, un podcast, videos y más.
Fuente: decrypt.co