El nuevo modelo llega a ChatGPT, la API y Codex (5 de marzo de 2026) y promete mejor razonamiento, manejo de hojas de cálculo y mayor integración con herramientas y navegadores

OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras

domingo 15 de marzo, 2026

OpenAI presentó el 5 de marzo de 2026 GPT‑5.4, su modelo de punta diseñado para tareas profesionales y disponible desde hoy en ChatGPT (como GPT‑5.4 Thinking), en la API (gpt-5.4) y en Codex. La compañía también puso en marcha una versión de mayor rendimiento, GPT‑5.4 Pro, dirigida a desarrolladores y a casos de uso más complejos.

Qué es GPT‑5.4 y qué cambia

GPT‑5.4 es un modelo de lenguaje grande (LLM, por sus siglas en inglés) que combina mejoras en razonamiento, programación y en la capacidad para trabajar con «agentes»: software que puede ejecutar flujos de trabajo en aplicaciones, navegar en páginas web y operar interfaces.

En términos sencillos, OpenAI describe al agente como una extensión del modelo que puede interactuar con herramientas externas —por ejemplo, abrir una hoja de cálculo, leer correos o hacer clic en una página— para completar tareas de varios pasos.

Entre las novedades técnicas destacan: contexto de hasta 1 millón de tokens (permitiendo trabajar en tareas largas), mejoras en eficiencia del razonamiento (usa menos tokens que GPT‑5.2) y capacidades nativas para «usar computadoras», como generar código con bibliotecas tipo Playwright y emitir comandos de ratón y teclado a partir de capturas de pantalla.

Rendimiento en tareas profesionales

OpenAI publica comparaciones con versiones anteriores y métricas de evaluación interna. En la prueba GDPval, que mide la capacidad de producir trabajo especializado en 44 ocupaciones, GPT‑5.4 igualó o superó a profesionales de la industria en 83.0% de las comparaciones (GPT‑5.2 obtuvo 70.9%).

En tareas de modelado de hojas de cálculo que realizaría un analista junior, GPT‑5.4 alcanzó 87.5% frente al 68.4% de GPT‑5.2. En evaluación de presentaciones, los evaluadores humanos prefirieron las de GPT‑5.4 el 68.0% de las veces sobre las de GPT‑5.2.

OpenAI también reporta mejoras en la precisión: en un conjunto de prompts anonimizados las afirmaciones individuales de GPT‑5.4 fueron 33% menos propensas a ser falsas y las respuestas completas 18% menos propensas a contener errores, comparado con GPT‑5.2.

Uso de la computadora, visión y agentes

GPT‑5.4 es, según OpenAI, el primer modelo de propósito general con capacidades nativas para operar computadoras y ejecutar flujos de trabajo en distintos entornos.

Esto incluye generación de scripts, interacción con interfaces a partir de capturas de pantalla y soporte para ajustar el comportamiento mediante mensajes de desarrollador y políticas de seguridad.

En pruebas de navegación y control de interfaz, GPT‑5.4 alcanzó 75.0% en OSWorld‑Verified (frente a 47.3% de GPT‑5.2) y superó el rendimiento humano reportado en esa evaluación (72.4%). En pruebas de uso de navegador también reportó mejoras (por ejemplo, Online‑Mind2Web 92.8% frente a 84.0% de un sistema anterior).

Además, la capacidad visual del modelo mejora la comprensión de imágenes densas y de alta resolución: la API ahora admite una fidelidad de entrada que, en el nivel “original”, permite hasta 10 millones de píxeles totales o una dimensión máxima de 6.000 píxeles.

Trabajo con herramientas y búsqueda de herramientas

Una mejora significativa es la «búsqueda de herramientas» en la API: en lugar de enviar al modelo la definición completa de decenas de miles de herramientas en cada solicitud, se le proporciona una lista ligera y una función para buscar la definición cuando la necesite.

OpenAI informa que, en una evaluación con 36 servidores MCP y 250 tareas, esto redujo el uso total de tokens un 47% manteniendo la precisión.

También se reportan mejoras en la llamada a herramientas por parte de agentes (es decir, decidir cuándo y cómo invocar APIs o conectores), con menor cantidad de turnos y mejor precisión en evaluaciones de flujos de trabajo reales.

Seguridad, disponibilidad y precios

OpenAI indica que despliega GPT‑5.4 con salvaguardas ampliadas: lo trata como de “alta capacidad cibernética” dentro de su marco de preparación, con controles de acceso, monitoreo y bloqueo o enrutamiento de solicitudes de mayor riesgo para ciertos clientes.

La empresa evaluó la posibilidad de que el modelo ofusque su razonamiento (Chain‑of‑Thought, CoT) y afirma que la «capacidad de controlabilidad de CoT» de GPT‑5.4 es baja, lo que consideran positivo para la supervisión.

En disponibilidad, GPT‑5.4 se implementa gradualmente en ChatGPT y Codex; en la API ya está como gpt-5.4 y gpt-5.4‑pro. En ChatGPT, la versión Thinking está disponible para suscriptores Plus, Team y Pro; Pro y Enterprise pueden acceder también a GPT‑5.4 Pro.

OpenAI publicó una tabla de precios por token para la API (por ejemplo, salida de gpt‑5.4: USD 15 / millón de tokens; gpt‑5.4‑pro: USD 180 / millón en salida).

Qué supone para las personas

Según la propia descripción de OpenAI, GPT‑5.4 apunta a mejorar tareas profesionales cotidianas —crear y editar documentos, hojas de cálculo, presentaciones y búsquedas web complejas— con respuestas más rápidas y menos iteraciones.

Para usuarios finales esto puede traducirse en asistentes más capaces al preparar informes, análisis sencillos o búsquedas profundas, siempre con las limitaciones y salvaguardas que OpenAI ha señalado.

Nota de Transparencia

Esta nota fue generada 100% con IA. La fuente fue aprobada por Diario Occidente y el contenido final fue revisado por un miembro del equipo de redacción.

🔊 El Resumen de Noticias sobre Inteligencia Artificial e Innovación Tecnológica, aquí 👇🏻

Tu navegador no soporta el elemento de video.

Curaduría editorial

La curaduría y revisión editorial de estas notas está a cargo de Rosa María Agudelo Ayerbe, comunicadora social y periodista, con maestría en Transformación Digital y especialización en Inteligencia Artificial.

Desde su rol como líder del equipo de innovación y transformación digital del Diario Occidente, y a través de la unidad estratégica DO Tech, realiza un seguimiento permanente a las principales novedades en tecnología e inteligencia artificial a nivel global.

Estas notas se apoyan en un agente de investigación basado en inteligencia artificial, diseñado para monitorear semanalmente avances, lanzamientos y debates clave del sector.

El contenido es posteriormente leído, analizado, contextualizado y validado editorialmente antes de su publicación.

Este proceso forma parte del mecanismo de actualización continua que permite interpretar los desarrollos tecnológicos desde una mirada periodística, crítica y comprensible para audiencias no especializadas.