2 dias atrás 2

Operator: conheça agente de IA da OpenAI que usa a Internet por você

Operator é o novo agente de inteligência artificial criado pela OpenAI, empresa dona do ChatGPT. A ferramenta foi divulgada no dia 23 de janeiro e consegue navegar pela Internet no lugar dos usuários. Conforme a OpenAI, o Operator consegue acessar o navegador e interagir com uma página da web para digitar, clicar e até rolar a tela. Dessa forma, a IA poderá fazer tarefas como preencher formulários, fazer compras e até mesmo reservar mesa em um restaurante. O objetivo seria auxiliar os usuários a gastarem menos tempo com tarefas repetitivas e atividades cotidianas. A seguir, saiba mais detalhes sobre a novidade.

 Reprodução/OpenAI Operator é o novo agente de inteligência artificial da OpenAI — Foto: Reprodução/OpenAI

O Operator está em fase experimental, disponibilizados apenas para os usuários Pro do ChatGPT nos Estados Unidos. Contudo, a empresa pretende disponibilizar a ferramenta para os assinantes dos planos Plus, Team e Enterprise, além de integrá-la ao ChatGPT no futuro.

Vale ressaltar que o Operator funciona por meio de um modelo conhecido como Computer-Using Agent (CUA), que une recursos do modelo GPT-4o e raciocínio avançado por meio de aprendizado por reforço. Sendo assim, a IA é treinada para interagir com botões, menus e campos de texto que os usuários também veem em uma página.

Com isso, o agente de IA consegue ver via capturas de tela e executar tarefas na web usando o mouse e o teclado, sem precisar de API (interface de programação de aplicação), código que atua como um conector. Na prática, o Operator faz a captura da tela, realiza a ação, escaneia a tela novamente e faz novas ações. O modelo também divide uma tarefa em várias etapas e trabalha em cada uma delas por vez.

Para usar o agente da IA, o usuário deve descrever a tarefa que gostaria de fazer com um comando enviado para o ChatGPT. Depois disso, a ferramenta consegue navegar pela Internet para fazer o que foi solicitado. Porém, em vez de usar o navegador do computador do usuário, o Operator envia o comando para um navegador remoto em um servidor da OpenAI. Portanto, o agente de IA poderá fazer várias tarefas ao mesmo tempo, como diversas guias abertas em um navegador.

Vale ressaltar que a ferramenta também poderá se corrigir caso cometa erros, ou apenas devolver o controle da navegação ao usuário, se precisar de assistência para resolver a tarefa. A OpenAI destaca que os usuários podem assumir o controle da navegação remota a qualquer momento, e que a IA é treinada para pedir que o usuário esteja no controle de tarefas que exigem login, envio de e-mails ou pagamento, por exemplo.

Outro destaque é a possibilidade de inserir instruções personalizadas para os momentos em que o Operator navegar em determinados sites, como definir companhias aéreas preferidas em um site de monitoramento de voos. Também é possível salvar prompts na página inicial, o que pode facilitar na hora de fazer tarefas repetidas no cotidiano.

Especialistas alertam, por fim, que o Operator atualmente funciona como uma prévia de pesquisa e que possui limitações. Mesmo que consiga lidar com muitas tarefas, o agente de IA continua evoluindo e pode cometer erros, especialmente com interfaces complexas, como apresentações de slides ou gerenciamento de calendários.

Veja também: 6 concorrentes do ChatGPT que você deveria testar

6 concorrentes do ChatGPT que você deveria testar

6 concorrentes do ChatGPT que você deveria testar

Leia o artigo inteiro

Do Twitter

Comentários

Aproveite ao máximo as notícias fazendo login
Entrar Registro