OpenAI ha anunciado el lanzamiento de Operator, un nuevo agente de inteligencia artificial capaz de realizar tareas en la web de manera autónoma utilizando su propio navegador. Actualmente, está disponible como una vista previa de investigación para los usuarios profesionales en Estados Unidos.
Operator puede llevar a cabo tareas repetitivas como el llenado de formularios, la compra online y la creación de contenido visual, interactuando con sitios web de manera similar a un usuario humano mediante escritura, clics y desplazamientos. El sistema se basa en el modelo Agente de Uso de Computadora (CUA), que combina capacidades de visión de GPT-4o con técnicas de aprendizaje de refuerzo. Esta tecnología permite a Operator identificar elementos en una página web, interactuar con ellos y corregir errores en el proceso.
¿Cómo funciona Operator?
El agente tiene la capacidad de "ver" las páginas web mediante capturas de pantalla e interactuar con ellas utilizando acciones como el uso del teclado y el ratón. Además, si se encuentra con dificultades o errores, puede autocorregirse o devolver el control al usuario para una experiencia colaborativa.
Los usuarios pueden personalizar sus flujos de trabajo configurando preferencias para tareas específicas, como seleccionar aerolíneas preferidas en sitios de reservas o automatizar la compra recurrente de productos. Asimismo, es posible ejecutar varias tareas simultáneamente, como reservar un camping mientras se compra un regalo personalizado.
En términos de seguridad, Operator incorpora varias medidas para garantizar un uso controlado. Entre ellas se encuentra el modo de adquisición, que requiere la intervención del usuario en puntos críticos como la introducción de credenciales o información de pago. También se incluyen confirmaciones de usuario, que solicitan autorización antes de ejecutar acciones relevantes, y limitaciones de tareas, que impiden la ejecución de funciones sensibles como transacciones bancarias o decisiones de contratación.
Disponibilidad
Por ahora, Operator está disponible exclusivamente para los suscriptores Pro en EE. UU., pero OpenAI planea expandir su acceso a otros niveles de suscripción, como Plus, Team y Enterprise, e integrarlo directamente en ChatGPT en el futuro.