OpenAI presentó oficialmente el día de ayer, 17 de julio, su nueva función estrella: ChatGPT Agent. Uno de los grandes avances, por no decir el más ambicioso hasta la fecha, con respecto a la IA conversacional. Ahora, ChatGPT no será un simple chatbot, sino que podrá llevar a cabo cualquier tarea que le pidamos de manera autónoma utilizando su propio ordenador virtual.
Y con tareas podemos referirnos a cuestiones de lo más cotidianas, pero también más avanzadas. Por ejemplo: compras online, análisis de datos, presentaciones, crear instrucciones para el uso de un producto, etc. Y vamos a poder hacerlo como hasta ahora, simplemente hablando con el propio chatbot de manera normal. Y todas estas nuevas funciones se las debemos a las capacidades de Operator (el sistema de navegación y de acciones en web), la potencia de investigación avanzada y la fluidez al hablar en lenguaje natural con ChatGPT.
De esta manera, el agente podrá alternar entre un modo de razonamiento y otro de acción real, lo que quiere decir que podrá llevar a cabo varios pasos para entregar resultados concretos. De esta manera, OpenAI se asegura contar con la herramienta más potente de IA más desarrollada hasta la fecha.
ChatGPT Agent: todo lo que debes saber
Qué es un Agente de IA
Un agente de inteligencia artificial es un paso mucho más profundo desarrollado que un chatbot para responder preguntas o mantener una conversación. Estamos hablando de un sistema que es capaz de tomar decisiones, ejecutar acciones dentro de sistemas digitales reales y resolver las tareas que se le pida de principio a fin. Siempre basándose en la lógica y su capacidad de autonomía.
Por lo tanto, ChatGPT Agent puede navegar por páginas webs, analizar información, interactuar con apps y automatizar los pasos de un trabajo. Y aun así, en ningún momento deja al humano fuera de supervisión. Vamos a tener el control del proceso en todo momento. Ya no hablamos simplemente de un chatbot de «texto inteligente», ahora también hablamos de «acción inteligente«.
Las mejoras de ChatGPT Agent
ChatGPT Agent es un antes y un después no solo para OpenAI y su chatbot, sino también porque ha superado en varios apartados a otros modelos de IA por cuestiones como:
Capacidad de acción real. No es un mero interlocutor de chat, ahora es un asistente real que puede realizar tareas que le pidamos utilizando un ordenador virtual propio. Y es que podemos navegar por la web, iniciar sesión en plataformas, tomar decisiones bajo un contexto particular o completar los procesos de manera autónoma. Lo puede hacer todo, y siempre bajo nuestras directrices.
Integración de todas las capacidades de ChatGPT. Combina para su propio funcionamiento las habilidades de buscar información, razonar, interpretar datos de todo tipo, escribir código… gracias a ello, el agente puede realizar, por ejemplo, una compra de entradas u organizar nuestra propia agenda.
Supervisión y control. Todas las acciones que el agente realiza se lleva a cabo en un entorno virtual aislado. Lo que quiere decir que en ningún momento entra a nuestro móvil o PC. Y antes de realizar cualquier operación importante, el sistema solicita la confirmación por parte del usuario, quien puede pausar, revisar o cancelar la tarea en el momento.
Benchmark técnico. El modelo tras ChatGPT Agent ha mejorado considerablemente el rendimiento con respecto a sus antecesores en test de referencia, llegando a duplicar incluso la puntuación de algunos de ellos. Así lo puedes ver en esta gráfica.
| Prueba de Referencia | ChatGPT Agent | Competidor / Modelo Anterior | Fuente del Dato |
|---|---|---|---|
| SpreadsheetBench | 45.5% | Copilot en Excel (20.0%) | OpenAI System Card (Jul 2025) |
| DSBench (Ciencia de Datos) | Supera a evaluadores humanos | GPT-4o (SOTA anterior) | OpenAI System Card (Jul 2025) |
| Humanity's Last Exam | 44.0% (con despliegue paralelo) | Mejora de +5.8% sobre el modo estándar | OpenAI System Card (Jul 2025) |
Has de saber que ChatGPT Agent se ha comenzado a desplegar ya para los usuarios Pro, Plus y Team, y llegará a los usuarios Enterprise y Education a lo largo del mes de julio.
Qué podemos hacer con ChatGPT Agent
El lanzamiento supone un avance en las funcionalidades de ChatGPT, pero no de manera progresiva, como hasta ahora. Sino de manera exponencial. Por lo tanto, podemos:
- Navegar e interactuar con la web: comprar productos, comparar precios, rellenar formularios…
- Automatizar documentos y datos: crear presentaciones, informes, bases de datos…
- Gestionar cuentas online: siempre con autorización, podremos interactuar con Gmail. Google Drive, GitHub, etc.
- Ejecución de código y script en tiempo real.
Tal y como te hemos expuesto anteriormente, todas estas acciones se harán bajo control de usuario y siempre de manera aislada con respecto a nuestro propio PC. Además, los usuarios Pro contarán con tareas «casi ilimitadas», según palabras de la propia OpenAI, mientras que el resto de usuarios de pago dispondrán de 50 tareas mensuales.
