OpenAI Operator é um agente do ChatGPT que pode concluir tarefas em um navegador da web em seu nome. Ele “vê” as páginas por meio de capturas de tela e, em seguida, clica, digita e rola para finalizar fluxos de trabalho com várias etapas.
O que o Operator pode fazer
Abrir sites e interagir com eles sem integrações especiais
Lidar com tarefas repetitivas, como preencher formulários, pedir mantimentos ou criar memes
Pedir sua ajuda quando necessário (login, senhas, confirmação de pagamento)
Como funciona
Construído com base no modelo Computer-Using Agent (CUA), treinado para operar interfaces gráficas comuns
Combina compreensão visual no estilo do GPT-4o (capturas de tela) com aprendizado por reforço para tomada de decisão
Tenta se recuperar de erros; se não conseguir, devolve o controle para você
Disponibilidade, privacidade e limites
Lançado em janeiro de 2025 como uma Research Preview para usuários do ChatGPT Pro baseados nos EUA
Para senhas e dados de pagamento, o Operator devolve o controle e não retém o que você inserir
Solicita confirmação antes de compras ou do envio de e-mails e recusa certas solicitações de alto risco (por exemplo, ações bancárias ou decisões de emprego)
Pode ter dificuldade com elementos complexos de interface (slideshows, calendários) e sites com muitos pop-ups ou CAPTCHAs
Espera-se que desenvolvedores possam usar esse agente “computer-using” em seus próprios serviços ao longo do tempo, com disponibilidade mais ampla nos planos do ChatGPT planejada para depois.

