OpenAI presenta Operator, su agente de IA para automatizar tareas como hacer la compra o reservar mesa

  • Es capaz de reservar un alojamiento o una mesa en un restaurante, o hacer la compra de la semana
  • Operator puede autocorregirse y los usuarios pueden tomar el control de la acción en cualquier momento
Interfaz de Operator

A comienzos de este año, en sus reflexiones para 2025, Sam Altman, CEO de OpenAI, apuntaba que los agentes de inteligencia artificial se sumarán en el corto plazo a la fuerza laboral y cambiarán materialmente el rendimiento de las empresas. Ahora, la compañía ha presentado Operator, un primer desarrollo de agente con capacidad para usar el navegador de internet y realizar tareas para el usuario. 

Operator de momento sólo está disponible para usuarios Pro en Estados Unidos y se trata de un experimento, o una vista previa de investigación, tal y como señala la compañía. Esto supone que presenta limitaciones y que evolucionará según el feedback que OpenAI recabe de los usuarios. 

La nueva herramienta supone el primer gran intento de la compañía en el desarrollo de agentes de inteligencia artificial, capaces de realizar tareas para los usuarios de manera independiente. Según señalan desde la firma, bastará con asignar una tarea a Operator para que éste la ejecute. 

Operator: asistencia en tareas cotidianas

El usuario podrá pedir al agente una serie de acciones para realizar en el navegador, como buscar el alojamiento de un viaje, reservar mesa en un restaurante o realizar la compra, lo que permitirá ahorrar tiempo en tareas cotidianas. En la interfaz de Operator, además, hay varias categorías de tareas que los usuarios pueden elegir, como compras, entregas, cenas y viajes, todas las cuales permiten diferentes tipos de automatización.

Los usuarios deberán introducir la instrucción de la tarea que desean que Operator realice y éste la llevará acabo. No obstante, los usuarios pueden tomar el control de la acción en cualquier momento y Operator está capacitado para solicitar la intervención del usuario en caso necesario, como inicios de sesión o información para realizar pagos. 
Además, si encuentra desafíos o comete errores, Operator puede autocorregirse, y en caso de bloquearse y necesitar ayuda, simplemente devuelve el control al usuario, lo que garantiza una experiencia fluida y colaborativa.

Tal y como explica OpenAI, los usuarios pueden personalizar sus flujos de trabajo en Operator agregando instrucciones personalizadas, como configurar preferencias de búsqueda en Booking.com. También permite guardar accesos rápidos en la página de inicio, ideal para tareas repetidas como reponer alimentos en Instacart. Asimismo, como sucedería con múltiples pestañas en un navegador, los usuarios pueden hacer que Operator ejecute diversas tareas de forma simultánea creando distintas conversaciones.

La compañía señala que Operator funciona con un nuevo modelo de inteligencia artificial llamado Computer-Using Agent (CUA). Combina capacidades de visión de GPT-4o con razonamiento avanzado, por lo que está capacitado para interactuar con interfaces gráficas de usuario (GUI), botones, menús y campos de texto de formularios como los que las personas ven habitualmente en una pantalla.
En este sentido, Operator puede "ver" a través de capturas de pantalla, e "interactuar" con el navegador utilizando todas las acciones que permiten un ratón y un teclado. 

Operator⁠ transforma la IA de una herramienta pasiva a un participante activo en el ecosistema digital”, explican desde OpenAI. “Agilizará las tareas de los usuarios y acercará los beneficios de los agentes a las empresas que desean experiencias de cliente innovadoras y mayores tasas de conversión”. 

Seguridad y limitaciones de Operator

La compañía explica que está colaborando con empresas como DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack y Uber, para integrar sus plataformas y servicios y garantizar que el agente aborda las necesidades del mundo real respetando la seguridad y privacidad del usuarios, así como las políticas, términos de servicio y la experiencia de dichas marcas. 

En términos de seguridad, OpenAI explica que Operator está diseñado para que el usuario tome el control en puntos críticos, para solicitar confirmaciones antes de finalizar cualquier tarea importante y para rechazar tareas confidenciales. Además, el usuario puede excluirse voluntariamente del entrenamiento de Operator y eliminar los datos de navegación. También está entrenado para pausar una tarea si un sitio le parece sospechoso y para rechazar solicitudes dañinas y bloquear contenido no permitido. 

Desde OpenAI ya avisan que Operator encuentra limitaciones en la realización de ciertas tareas, especialmente con interfaces complejas, como la creación de presentaciones de diapositivas o la administración de calendarios. Por ello espera que la fase de pruebas de investigación le permita solventar estas limitaciones con ayuda de los comentarios de los usuarios. 

Con todo, OpenAI no es la primera compañía en presentar sus agentes de inteligencia artificial al mercado. A finales del año pasado Google presentó Project Mariner., su propio agente, respaldado por su suite de modelos Gemini, con capacidad para realizar acciones en la web. Y antes de eso, Anthropic presentó una nueva versión de Claude, también con capacidad para interactuar con el ordenador.