Компанія OpenAI оголосила про оновлення моделі штучного інтелекту, що підтримує її агента Operator. Цей агент здатний автономно переглядати веб та використовувати певне програмне забезпечення в облачній віртуальній машині для виконання запитів користувачів.
Про це розповідає ProIT
У найближчий час Operator буде використовувати модель на основі o3, однієї з останніх у серії моделей «reasoning» компанії OpenAI. Раніше агент базувався на кастомізованій версії GPT-4o.
Відповідно до багатьох критеріїв, o3 є набагато більш просунутою моделлю, особливо в завданнях, що вимагають математичних розрахунків і логічного мислення.
«Ми замінюємо існуючу модель на основі GPT‑4o для Operator на версію, засновану на OpenAI o3», — йдеться в блозі OpenAI. «API-версія [Operator] залишиться на основі 4o».
Operator є лише одним із багатьох агентів, які були представлені компаніями в сфері штучного інтелекту в останні місяці. Компанії змагаються за створення висококласних агентів, які можуть надійно виконувати завдання практично без нагляду.
Google пропонує агент для «використання комп’ютера» через свій API Gemini, який може так само переглядати веб і виконувати дії від імені користувачів, а також пропонує споживчий продукт під назвою Mariner. Моделі компанії Anthropic також здатні виконувати комп’ютерні завдання, включаючи відкриття файлів і навігацію веб-сторінками.
Згідно з інформацією від OpenAI, нова модель Operator, відома як o3 Operator, була «додатково налаштована з урахуванням даних безпеки для використання комп’ютера», включаючи датасети, створені для «навчання моделі [OpenAI] межам її рішень щодо підтвердження і відмови».
OpenAI опублікувала технічний звіт, у якому продемонстровано продуктивність o3 Operator у специфічних оцінках безпеки. У порівнянні з моделлю GPT-4o Operator, o3 Operator менш ймовірно відмовиться виконувати «незаконні» дії та шукати чутливі особисті дані, а також менш підданий впливу атаки штучного інтелекту, відомої як injection prompt, згідно з технічним звітом.
«o3 Operator використовує той же багатошаровий підхід до безпеки, який ми використовували для версії 4o Operator», — зазначає OpenAI в своєму блозі. «Хоча o3 Operator успадковує можливості кодування o3, він не має нативного доступу до середовища кодування або терміналу».