OpenAI Operator — это новый агент в ChatGPT, который самостоятельно выполняет задачи в браузере. Он умеет «видеть» страницы с помощью скриншотов, кликать, вводить текст и прокручивать экран. Сервис вышел в январе 2025 года и пока доступен как Research Preview только для американских пользователей тарифа Pro. Ниже — кратко о ключевых особенностях.
Что делает Operator
- Заходит на сайты и взаимодействует с ними без специальных интеграций.
- Выполняет однотипные рутинные задачи: заполняет формы, заказывает продукты, создает мемы.
- При сложностях просит помощи пользователя: просит ввести логин, пароль, подтвердить оплату.
Как работает
Operator основан на модели Computer-Using Agent или CUA — она тренирована управлять привычными графическими интерфейсами. Обучение: комбинирует «зрение» GPT-4o может анализировать скриншоты и логику через reinforcement learning. Контроль: если Operator ошибся или зашел в тупик, он пытается сам себя исправить. Если не получается — возвращает управление пользователю. В результате Operator может решать задачи на большинстве сайтов, не дожидаясь, пока появится специальный API.
Как использовать
- Сформулируйте задачу — напишите, что нужно сделать.
- Отслеживайте действия — Operator «ходит» по страницам, кликает, вводит данные.
- Берите управление — если нужно ввести личные сведения или пройти CAPTCHA.
- Проверяйте и подтверждайте — при оформлении важных действий Operator попросит разрешение.
Можно сохранять любимые шаблоны задач (например, «купить продукты»), а также параллельно вести несколько сценариев в разных разговорах.
Безопасность и конфиденциальность
- При вводе паролей, платежных данных Operator уступает управление и не запоминает введенную информацию.
- Перед покупками или отправкой писем агент спрашивает разрешение.
- Operator откажется от «опасных» просьб — операций в банке, принятия решений по трудоустройству.
- В настройках можно стереть все сессии, выход из всех аккаунтов — одним кликом.
- Система умеет распознавать подозрительные сайты и останавливать работу.
Ограничения
Сервис умеет многое, но пока «ошибается» на сложных интерфейсах, например, при работе со слайд-шоу или календарями. Доступен только в США, в режиме тестирования для Pro-пользователей ChatGPT. Может некорректно взаимодействовать с некоторыми сайтами, где много всплывающих окон или капчи.
Что дальше
Разработчики смогут напрямую использовать «компьютерно-действующего» агента в своих сервисах. Команда OpenAI обещает повысить точность Operator и научить его работать со сложными формами и длинными сценариями. Позже Operator планируют добавить в ChatGPT для Plus, Team и Enterprise-пользователей по всему миру.