Категории
© AIDive | 2025 | Все права защищены.
Нововведение в ChatGPT от OpenAI для управления ПК или ноутбуком. Выполняет простые и рутинные задачи.
OpenAI Operator — это новый агент в ChatGPT, который самостоятельно выполняет задачи в браузере. Он умеет «видеть» страницы с помощью скриншотов, кликать, вводить текст и прокручивать экран. Сервис вышел в январе 2025 года и пока доступен как Research Preview только для американских пользователей тарифа Pro. Ниже — кратко о ключевых особенностях.
Operator основан на модели Computer-Using Agent или CUA — она тренирована управлять привычными графическими интерфейсами. Обучение: комбинирует «зрение» GPT-4o может анализировать скриншоты и логику через reinforcement learning. Контроль: если Operator ошибся или зашел в тупик, он пытается сам себя исправить. Если не получается — возвращает управление пользователю. В результате Operator может решать задачи на большинстве сайтов, не дожидаясь, пока появится специальный API.
Можно сохранять любимые шаблоны задач (например, «купить продукты»), а также параллельно вести несколько сценариев в разных разговорах.
Сервис умеет многое, но пока «ошибается» на сложных интерфейсах, например, при работе со слайд-шоу или календарями. Доступен только в США, в режиме тестирования для Pro-пользователей ChatGPT. Может некорректно взаимодействовать с некоторыми сайтами, где много всплывающих окон или капчи.
Разработчики смогут напрямую использовать «компьютерно-действующего» агента в своих сервисах. Команда OpenAI обещает повысить точность Operator и научить его работать со сложными формами и длинными сценариями. Позже Operator планируют добавить в ChatGPT для Plus, Team и Enterprise-пользователей по всему миру.