ChatGPT Agent от OpenAI: Автономные действия на виртуальном ПК

OpenAI анонсировала запуск ChatGPT Agent — инновационного инструмента с расширенными возможностями автономной работы. Новый агент создан для выполнения разнообразных задач от имени пользователя, используя собственный виртуальный компьютер, что существенно расширяет функционал по сравнению с предыдущими решениями компании.

Об этом сообщает ProIT

Возможности и принцип работы ChatGPT Agent

ChatGPT Agent основан на специально разработанной модели, которую обучали выполнять комплексные задачи с использованием различных инструментов: текстового и визуального браузеров, терминала и импорта пользовательских данных. С помощью этого агента можно проверять веб-сайты, фильтровать результаты поиска, автоматизировать вход в системы, запускать код, анализировать данные, создавать электронные таблицы и презентации. Например, он способен просматривать ваш календарь и подготавливать расписание встреч, составлять список покупок для семьи или создавать презентацию на основе анализа конкурентов.

Выполняя задачи в среде собственного виртуального компьютера, агент имеет доступ ко всему необходимому контексту. Он может, например, загрузить файл с сайта, обработать его через терминал и просмотреть результат в браузере. Работа над ChatGPT Agent ведется объединенной командой из 20–35 специалистов, которые ранее разрабатывали OpenAI Operator и Deep Research.

Сценарии использования и безопасность

На демонстрации OpenAI представила несколько реальных сценариев работы ChatGPT Agent. Среди них — планирование свидания: агент самостоятельно проверяет время в Google Calendar, находит ресторан через OpenTable и бронирует столик. Пользователь может добавлять новые параметры, например, изменять категории ресторанов. Другой пример — генерация отчета о популярности игрушек Labubus в сравнении с Beanie Babies.

ChatGPT Agent также эффективен для онлайн-шопинга и рутинных задач, в частности для регулярного подачи заявок на парковочные места. Благодаря доступу к виртуальному компьютеру, агент может выполнять сложные и длительные задачи в фоновом режиме, позволяя пользователю возвращаться к готовым результатам позже. Хотя скорость выполнения не всегда высокая, если процесс занимает 15–30 минут, это все равно экономит время по сравнению с ручной работой.

Для повышения безопасности агент всегда запрашивает разрешение пользователя перед отправкой писем или бронированием. При работе с финансовыми сайтами активируется режим наблюдения — агент действует только в текущей вкладке и останавливается при переключении на другую.

«OpenAI утверждает, что ChatGPT Agent демонстрирует отличные результаты в различных тестах, оценивающих возможности просмотра веб-страниц и выполнения реальных задач. Например, он достигает точности 27,4% в FrontierMath, значительно превосходит человеческую продуктивность в задачах обработки данных DSBench⁠, набирает 65,4% в WebArena».

ChatGPT Agent уже постепенно становится доступным для пользователей с тарифами Pro, Plus и Team через меню инструментов или команду /agent. В течение лета поддержка появится и для корпоративных и образовательных подписок. Для стран Европейской экономической зоны и Швейцарии дата запуска на данный момент не определена.