El siguiente paso de Openai hacia el futuro ‘agente’


Con los fabricantes de laptop y los teléfonos inteligentes como Samsung extendiendo IA generativa a través de Todos los aspectos de sus dispositivosOperai está intentando lo mismo con una herramienta de agente anunciada el 23 de enero. La herramienta, llamada operador, se ejecuta con la misma tecnología básica que ChatGPT pero reside dentro de un navegador web patentado. Esto le permite realizar acciones de forma autónoma como ordenar comestibles o tours de reserva.

OpenAi sugerido en una publicación de blog El operador podría “OPE[n] Ups nuevas oportunidades de compromiso para las empresas “, pero no elaboró.

¿Qué es el operador de OpenAI?

El operador es una aplicación que incluye un navegador web y el modelo AI generativo GPT-4O. Es el resultado de Un proyecto Operai Para entrenar las capacidades de visión de GPT-4O en las interfaces gráficas de usuario que se encuentran en las páginas web típicas. Su capacidad para hacer planes de varios pasos y corregir errores independientes si es necesario, aparte de otros esfuerzos para crear IA agente, OpenAi se jactó. El modelo de agente de uso informático del operador (CUA) está capacitado específicamente en los botones, formularios y menús que probablemente se encuentren en una página web.

El operador está en beta. Operai dijo que los comentarios de los usuarios en etapa inicial se utilizarán para mejorarlo.

Los suscriptores de ChatGPT Pro pueden suscribirse al operador a partir de hoy.

Operai planea proporcionar al operador a Plus, Team y Enterprise pronto. El gigante tecnológico también tiene la intención de integrar sus capacidades en ChatGPT en general. Incluirán el CUA en su API “pronto”, según la publicación del blog.

¿Cómo funciona el operador?

La compañía dice que la técnica de razonamiento de la CUA, que llaman un “monólogo interno”, ayuda al modelo a comprender los pasos intermedios y adaptarse a la entrada inesperada. Debajo del capó, CUA toma capturas de pantalla de páginas web y utiliza un mouse virtual y un teclado para navegar.

Al igual que con CHATGPT, los usuarios pueden agregar instrucciones personalizadas que el operador recordará, como la aerolínea preferida del usuario.

Ver: los actores de amenaza pueden jailbreak generativo ai para crear automáticamente correos electrónicos de phishing y otro contenido malicioso.

Los usuarios pueden solicitar al operador en lenguaje natural de la misma manera que pueden solicitar ChatGPT. El operador está capacitado para preocuparse por iniciar sesión en sitios, proporcionar detalles de pago o pasar Captchas, por lo que el control de la mano volverá al usuario para esos pasos. El operador está programado para no aceptar solicitudes, como realizar transacciones bancarias, o para evaluar situaciones de alto riesgo, como decidir si contratar a un empleado.

Si el operador encuentra una interfaz con la que no puede predecir cómo interactuar, le devolverá la tarea al usuario. Operai colaboró ​​directamente con las siguientes compañías para asegurarse de que el operador pueda interactuar con sus sitios:

  • Doordash.
  • Instacart.
  • Abierta.
  • Priceline.
  • Stubhub.
  • Chinche.
  • Uber.

Openai señala que la iteración temprana del operador tiende a luchar con “interfaces complejas”, incluida la creación de presentaciones de diapositivas o agregar elementos a los calendarios.

El operador entra en un paisaje de IA generativo lleno de gente

Algunas de la funcionalidad del operador se superponen con las herramientas de la competencia, como Google Gemini o Apple Intelligence.

El operador invita a la comparación con el muy difamado de Microsoft Recordar Característica, que utiliza capturas de pantalla para navegar por una PC. El operador también comparte algunas capacidades con Google Lens en Chrome. Sin embargo, su capacidad para navegar sitios web de forma autónoma podría ser un punto de diferenciación. La IA Agentic, en la que los modelos generativos de IA realizan mandados de varios pasos en la cuenta del usuario, es la nueva cosa en tecnología o una nueva forma de empaquetar los productos aún limitados.

Leave a Reply

Your email address will not be published. Required fields are marked *