OpenAI ha anunciado el lanzamiento de GPT‑5.4, una nueva generación de su familia de modelos pensada para acelerar el trabajo profesional y reducir la fricción en tareas complejas. La compañía lo despliega desde hoy en ChatGPT, en la API y en Codex, con una variante llamada GPT‑5.4 Thinking orientada a razonamiento, y una edición GPT‑5.4 Pro para quienes buscan el máximo rendimiento. La promesa es clara: más capacidad en razonamiento, código y flujos con herramientas, con menos iteraciones y respuestas más ajustadas a lo que se pide.
Un modelo unificado para razonamiento, código y tareas de oficina
GPT‑5.4 integra avances recientes en razonamiento, programación y trabajo con herramientas en un solo modelo de frontera. OpenAI destaca que incorpora las capacidades de codificación de GPT‑5.3‑Codex y, al mismo tiempo, mejora su desempeño en entornos de software y tareas habituales de oficina, como hojas de cálculo, presentaciones y documentos. El objetivo es que el modelo complete encargos largos con mayor precisión y eficiencia, con menos necesidad de aclaraciones.
En ChatGPT, GPT‑5.4 Thinking añade una novedad práctica: puede presentar un plan inicial de su enfoque en consultas más largas, de modo que el usuario pueda reconducir el resultado mientras se elabora la respuesta. También se refuerzan la investigación web profunda para búsquedas muy específicas y el mantenimiento de contexto en preguntas que requieren más tiempo de razonamiento.
Rendimiento en conocimiento y productividad
OpenAI acompaña el anuncio con resultados en pruebas internas y públicas. En GDPval, una evaluación centrada en trabajo de conocimiento en 44 ocupaciones, GPT‑5.4 iguala o supera a profesionales del sector en el 83,0 por ciento de las comparaciones, frente al 70,9 por ciento de GPT‑5.2. La empresa también subraya mejoras en la creación y edición de hojas de cálculo, documentos y presentaciones, con un salto notable en una prueba interna de modelado en hojas de cálculo: 87,3 por ciento de media para GPT‑5.4 frente al 68,4 por ciento de GPT‑5.2.
En paralelo, afirma haber reducido errores y alucinaciones: en un conjunto de solicitudes desidentificadas donde usuarios señalaron fallos, las afirmaciones individuales de GPT‑5.4 serían un 33 por ciento menos propensas a ser falsas, y las respuestas completas un 18 por ciento menos propensas a contener cualquier error, en comparación con GPT‑5.2.
Uso del ordenador y visión, el salto para agentes
El lanzamiento también marca un paso relevante para desarrolladores: GPT‑5.4 es el primer modelo generalista de OpenAI con capacidades nativas de uso del ordenador, pensado para agentes que operan aplicaciones y webs combinando capturas de pantalla con acciones de teclado y ratón. La compañía resalta su utilidad tanto para automatización mediante librerías como Playwright como para interacción basada en coordenadas.
En OSWorld‑Verified, una prueba de navegación por escritorio mediante capturas y acciones, GPT‑5.4 alcanza un 75,0 por ciento de éxito, frente al 47,3 por ciento de GPT‑5.2, y por encima del rendimiento humano reportado del 72,4 por ciento. En comprensión visual, GPT‑5.4 mejora en MMMU‑Pro hasta el 81,2 por ciento sin herramientas, por encima del 79,5 por ciento de GPT‑5.2. Además, introduce un nivel de detalle de entrada de imagen original para preservar fidelidad en imágenes densas y de alta resolución, con soporte de hasta 10,24 millones de píxeles totales o 6.000 píxeles de dimensión máxima.
Herramientas, búsqueda y eficiencia de tokens
Otra pieza clave es el trabajo con ecosistemas de herramientas. En la API, GPT‑5.4 incorpora tool search, una forma de no incluir todas las definiciones de herramientas desde el inicio y consultarlas solo cuando se necesitan.Este enfoque reduce el uso de tokens en flujos con muchas herramientas y ayuda a escalar a entornos con conectores extensos.
La compañía también insiste en la eficiencia: GPT‑5.4 sería su modelo de razonamiento más eficiente en tokens hasta la fecha, utilizando menos tokens para resolver problemas frente a GPT‑5.2, lo que se traduce en menor coste efectivo y mayor velocidad.
Disponibilidad, transición de modelos y precios en la API
GPT‑5.4 se despliega gradualmente hoy en ChatGPT y Codex. En ChatGPT, GPT‑5.4 Thinking llega a planes Plus, Team y Pro, sustituyendo a GPT‑5.2 Thinking. OpenAI mantendrá GPT‑5.2 Thinking disponible durante tres meses en la sección de modelos Legacy para usuarios de pago y lo retirará el 5 de junio de 2026.
En la API, GPT‑5.4 está disponible como gpt‑5.4 y GPT‑5.4 Pro como gpt‑5.4‑pro. El precio por token de GPT‑5.4 es superior al de GPT‑5.2, aunque espera compensarlo con mayor eficiencia. Los precios anunciados son 2,50 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida para gpt‑5.4, frente a 1,75 y 14 dólares, respectivamente, en gpt‑5.2. Para las variantes Pro, gpt‑5.4‑pro se sitúa en 30 dólares por millón de tokens de entrada y 180 dólares por millón de tokens de salida, mientras que gpt‑5.2‑pro figura en 21 y 168 dólares.
Conclusión
Con GPT‑5.4, OpenAI busca consolidar en un único modelo de frontera el tridente que más pesa en el trabajo profesional actual: razonamiento, programación y ejecución asistida por herramientas. La compañía presenta mejoras medibles en tareas de conocimiento, en hojas de cálculo y en capacidades de agente para operar ordenadores, además de un foco explícito en reducir errores y optimizar el consumo de tokens. El despliegue inmediato en ChatGPT, Codex y la API, junto a la transición planificada de GPT‑5.2 Thinking hasta el 5 de junio de 2026, dibuja una apuesta por simplificar la elección de modelos y llevar los flujos de trabajo con agentes a un uso más cotidiano y productivo.
Para mas información :👇




