ChatGPT intenta amortiguar la pérdida de usuarios con GPT-5.4: un modelo capaz de controlar tu ordenador

OpenAI presenta el más reciente de sus avances en modelos de IA con GPT-5.4 que marcará un nuevo umbral de éxito en tareas y operaciones superando lo que podría hacer un humano frente a las apps y a la web misma

ChatGPT intenta amortiguar la pérdida de usuarios con GPT-5.4: un modelo capaz de controlar tu ordenador
OpenAI eleva el nivel con GPT-5.4
Publicado en Tecnología

OpenAI no quiere ceder nada de terreno en esta lucha tecnología que ha representado la IA en los últimos años y es por eso que sigue creciendo con la presentación de un nuevo modelo. GPT-5.4 es su modelo de IA más avanzado hasta el momento y han logrado hacer de su sistema uno más capaz y eficiente. Y no llega solo ya que se ha puesto a disposición la API y una plataforma llamada Codex. Lo que sorprende es lo que viene a continuación, el modelo será capaz de controlar un ordenador de forma nativa como si un humano lo hiciera con apps y en la web. Existen dos versiones dependiendo del tipo de suscriptor.

OpenAI no quiere perder sino seguir ganando, lo hará con un nuevo modelo GPT-5.4

Los lanzamientos son los siguientes. GPT-5.4 Thinking que es dedicado a los suscriptores de ChatGPT Plus, Team y Pro mientras que GPT-5.4 Pro será para los suscriptores Pro y Enterprise. La ventaja es que el primero ofrece un plan de razonamiento antes de que comience a operar, por lo que es posible realizar correcciones sin empezar de cero. Los datos que hay detrás de este modelo son sorprendentes. Un benchmark llamado OSWorld-Verified ha medido la capacidad que tiene frente a un entorno de escritorio real, GPT-5.4 alcanza un 75% de éxito superando extrañamente lo que haría un humano registrado en 72,4%. GPT-5.2 alcanzaba en su momento 47,3%, lo cual es un subidón impresionante de desempeño.

La gente de OpenAI señala que este modelo fue diseñado para tareas de conocimiento profesional. Van desde presentaciones hasta hojas de cálculo contables. En un benchmark interno sobre modelos financieros, GPT-5.4 alcanzó un 87.3% superando a GPT-5.2 que registró 68,4%. Y eso no se detiene ahí, otro test GDPval que evalúa a los agentes de IA con el trabajo real de 44 ocupaciones ha superado nuevamente a humanos con un 83% de efectividad. Sus afirmaciones tienen un 33% menos probabilidad de ser falsas.

Cuando este modelo pueda aterrizar de manera gratuita podría superar a Gemini

Otra medición que comprueba la contundencia del modelo es la que permite a los agentes planificar y verificar tareas en horizontes temporales extensos, GPT-5.4 soporta hasta un millón de tokens en ventanas de contexto. Otro benchmark dedicado a este tipo de actividad, con 250 tareas y 36 servidores habilitados, el consumo total de tokens se redujo hasta un 47% con la misma precisión.

Sin duda alguna, este modelo podría competir perfectamente con Gemini 3 y es una batalla en toda regla para ver cuál es mejor. Lo malo es que esto solo se limitará a usuarios de pago, por lo que en un futuro, si se llega a liberar de forma gratuita, ChatGPT podría volver a retomar el liderazgo que perdió. Los avances tecnológicos respecto a este tipo de modelos continuarán hasta desconocer límites, ¿quién ganará?

Puedes seguir a iPadizate en Facebook, WhatsApp, Twitter (X) o consultar nuestro canal de Telegram para estar al día con las últimas noticias de tecnología.

Para ti
Queremos saber tu opinión. ¡Comenta!