
OpenAI continúa acelerando el desarrollo de su inteligencia artificial. Apenas unos días después de presentar GPT-5.3 Instant, la compañía ha anunciado GPT-5.4, su nuevo modelo insignia orientado a tareas complejas y entornos profesionales.
El modelo llega en dos variantes principales:
- GPT-5.4 Thinking
- GPT-5.4 Pro
Ambas versiones reflejan una evolución clara en la estrategia de OpenAI: pasar de simples chatbots conversacionales a agentes digitales capaces de trabajar de forma autónoma.
La rápida sucesión de lanzamientos deja claro que la compañía intenta mantenerse por delante de competidores como Gemini 3.1 Pro de Google y Claude Opus 4.6 de Anthropic.
La era del uso nativo del ordenador
Una de las novedades más importantes de GPT-5.4 es su capacidad nativa para utilizar un ordenador.
Por primera vez en un modelo principal de OpenAI, la IA puede:
- Ejecutar comandos de ratón y teclado
- Navegar por interfaces de escritorio
- Interpretar capturas de pantalla de aplicaciones
- Interactuar con múltiples programas al mismo tiempo
En la práctica, esto permite que el sistema realice tareas completas de forma autónoma, como:
- Rellenar hojas de cálculo en Excel
- Realizar investigaciones en la web
- Generar presentaciones en PowerPoint
- Combinar información entre varias aplicaciones
El modelo funciona mediante un ciclo continuo de “construir-ejecutar-verificar-corregir”, lo que le permite revisar su propio trabajo y corregir errores automáticamente.
Este enfoque responde a la creciente competencia en el mercado empresarial. Recientemente, Microsoft integró modelos de Anthropic en Microsoft Copilot dentro de Microsoft 365, tras comprobar que Claude generaba mejores hojas de cálculo y presentaciones que modelos anteriores de OpenAI.
GPT-5.4 es la respuesta directa de OpenAI para intentar recuperar terreno en el sector corporativo.
Una nueva interfaz para ajustar la planeación
Con GPT-5.4 Thinking, OpenAI también cambia la forma en que los usuarios interactúan con la inteligencia artificial.
En lugar de limitarse a ofrecer una respuesta final, el sistema muestra primero un plan detallado de su razonamiento y de las acciones que pretende realizar.
Los usuarios pueden:
- Observar ese plan en tiempo real
- Corregirlo o ajustar pasos durante la ejecución
- Guiar el proceso sin tener que empezar de nuevo con otro prompt
Este enfoque resulta especialmente útil para tareas complejas o profesionales, donde un pequeño malentendido puede obligar a repetir todo el proceso.
La función se está desplegando actualmente en ChatGPT web y Android, con soporte para iOS previsto próximamente.
Un contexto masivo y mayor precisión
Para soportar tareas complejas y procesos largos, GPT-5.4 incorpora:
- Ventana de contexto de 1 millón de tokens
- Capacidad para analizar bases de código completas
- Procesamiento de grandes colecciones de documentos
El modelo también introduce técnicas para compactar la ventana de contexto, que permiten mantener el contexto relevante durante tareas largas sin perder información clave. Esto es algo que ya hacía Anthropic.
En tareas de investigación, GPT-5.4 destaca en consultas tipo “aguja en un pajar”, realizando múltiples rondas de búsqueda en internet para sintetizar información difícil de encontrar.
OpenAI afirma además que es su modelo más fiable hasta la fecha, con una reducción de hasta 33 % en alucinaciones con respecto a GPT-5.2.
En el benchmark profesional GDPval, que evalúa capacidades en áreas como finanzas, derecho y marketing, GPT-5.4 alcanzó un 83 % de éxito, frente al 70,9 % obtenido por su predecesor.
Disponibilidad y precio
El nuevo modelo está claramente orientado a profesionales, empresas y desarrolladores, por lo que no estará disponible para usuarios Free o Go.
El despliegue se realizará gradualmente en:
- ChatGPT
- Codex
- la API de OpenAI
El calendario previsto es el siguiente:
- GPT-5.4 Thinking será el modelo de razonamiento por defecto para suscriptores Plus, Team y Pro, reemplazando a GPT-5.2 Thinking en los próximos tres meses.
- GPT-5.4 Pro, optimizado para cálculos matemáticos y científicos avanzados, estará disponible únicamente para Enterprise, Educación y clientes de API.
Para desarrolladores, el modelo promete mayor eficiencia en tareas complejas con herramientas externas, aunque el precio también aumenta. El costo de un millón de tokens de entrada pasa a $2,50, frente a los $1,75 del modelo anterior.
La apuesta empresarial de OpenAI
Con aproximadamente 25 000 millones de dólares de ingresos anualizados y enormes inversiones en infraestructura de centros de datos, OpenAI necesita convertir su tecnología en un negocio sostenible.
Al transformar ChatGPT de un simple asistente conversacional en un agente profesional capaz de realizar trabajo real, GPT-5.4 podría convertirse en la herramienta clave para consolidar la posición de OpenAI en el mercado empresarial y en el futuro de la inteligencia artificial. Sin embargo, no va a ser fácil, la competencia va a ser feroz.

Deja una respuesta