ChatGPT Agent від OpenAI: автономні дії на віртуальному комп'ютері

OpenAI анонсувала запуск ChatGPT Agent — інноваційного інструмента з розширеними можливостями автономної роботи. Новий агент створений для виконання різноманітних завдань від імені користувача, використовуючи власний віртуальний комп’ютер, що суттєво розширює функціонал порівняно з попередніми рішеннями компанії.

Про це розповідає ProIT

Можливості та принцип роботи ChatGPT Agent

ChatGPT Agent базується на спеціально розробленій моделі, яку навчали виконувати комплексні завдання з використанням різних інструментів: текстового та візуального браузерів, терміналу й імпорту користувацьких даних. За допомогою цього агента можна перевіряти веб-сайти, фільтрувати результати пошуку, автоматизувати вхід у системи, запускати код, аналізувати дані, створювати електронні таблиці й презентації. Наприклад, він здатен переглянути ваш календар і підготувати розклад зустрічей, скласти список покупок для родини або створити презентацію на основі аналізу конкурентів.

Виконуючи завдання у середовищі власного віртуального комп’ютера, агент має доступ до всього необхідного контексту. Він може, наприклад, завантажити файл з сайту, обробити його через термінал і переглянути результат у браузері. Робота над ChatGPT Agent ведеться об’єднаною командою з 20–35 фахівців, які раніше розробляли OpenAI Operator і Deep Research.

Сценарії використання та безпека

На демонстрації OpenAI представила кілька реальних сценаріїв роботи ChatGPT Agent. Серед них — планування побачення: агент самостійно перевіряє час у Google Calendar, знаходить ресторан через OpenTable і бронює столик. Користувач може додавати нові параметри, наприклад, змінювати категорії ресторанів. Інший приклад — генерація звіту щодо популярності іграшок Labubus у порівнянні з Beanie Babies.

ChatGPT Agent також ефективний для онлайн-шопінгу і рутинних завдань, зокрема для регулярного подання заявок на паркувальні місця. Завдяки доступу до віртуального комп’ютера, агент може виконувати складні та тривалі задачі у фоновому режимі, дозволяючи користувачеві повертатися до готових результатів пізніше. Хоча швидкість виконання не завжди висока, якщо процес займає 15–30 хвилин, це все одно економить час порівняно з ручною роботою.

Для підвищення безпеки агент завжди запитує дозвіл користувача перед надсиланням листів чи бронюванням. При роботі з фінансовими сайтами активується режим спостереження — агент діє лише у поточній вкладці та зупиняється при перемиканні на іншу.

“OpenAI стверджує, що ChatGPT Agent демонструє чудові результати в різних тестах, що оцінюють можливості перегляду веб-сторінок та виконання реальних завдань. Наприклад, він досягає точності 27,4% у FrontierMath, значно перевершує людську продуктивність у завданнях обробки даних DSBench⁠, набирає 65,4% у WebArena”.

ChatGPT Agent вже поступово стає доступним для користувачів з тарифами Pro, Plus і Team через меню інструментів або команду /agent. Протягом літа підтримка з’явиться і для корпоративних та освітніх підписок. Для країн Європейської економічної зони та Швейцарії дата запуску наразі не визначена.