OpenAI офіційно анонсувала запуск нового штучного інтелектуального агента під назвою Operator. Цей інструмент покликаний автоматизувати дії у браузері, забезпечуючи взаємодію з елементами на екрані, такими як кнопки та текстові поля, подібно до того, як це робить людина.
Про це розповідає ProIT
Нова модель штучного інтелекту
Operator працює на основі нової моделі штучного інтелекту, відомої як Computer-Using Agent (CUA). Ця технологія дозволяє агенту керувати комп’ютером через візуальний інтерфейс, комбінуючи потужності GPT-4o з можливостями розпізнавання зображень та вдосконаленим механізмом міркування. Процес роботи агента складається з кількох етапів: спочатку він робить знімки екрана, аналізує їх та визначає, які дії потрібно виконати. Згодом, за допомогою симуляції миші та клавіатури, агент може здійснювати натискання, прокручування або введення тексту.
Під час виконання своїх завдань Operator відображає всі дії в маленькому вікні браузера, що дозволяє користувачам контролювати процес.
Безпека та доступність
Хоча технологія є відносно новою, вона вже демонструє хороші результати у виконанні повторюваних завдань, таких як створення списків покупок. Проте, агент може стикатися з труднощами при роботі з незнайомими інтерфейсами, наприклад, таблицями чи календарями, а також при редагуванні складних текстів.
OpenAI також реалізувала кілька елементів безпеки у новому інструменті, які вимагають підтвердження користувача перед виконанням важливих дій, таких як надсилання електронних листів або здійснення покупок. Крім того, Operator має обмеження на доступ до певних типів контенту, зокрема до сайтів для дорослих та азартних ігор.
З сьогоднішнього дня оператор доступний в попередньому перегляді для підписників ChatGPT Pro за $200 (лише у США). У майбутньому OpenAI планує розширити доступ до інструмента для власників тарифів Plus, Team та Enterprise, а також інтегрувати Operator безпосередньо в ChatGPT і випустити CUA через API для розробників.
Попередній перегляд дозволить OpenAI зібрати відгуки про роботу Operator та вдосконалити систему.
“A research preview of Operator, an agent that can use its own browser to perform tasks for you.”
OpenAI не є єдиним гравцем на ринку «агентських» систем ШІ. У грудні минулого року Google представила Project Mariner, який виконує автоматизовані завдання в браузері Chrome. Також у грудні аналогічну систему анонсувала компанія Anthropic.