Компания OpenAI объявила об обновлении модели искусственного интеллекта, поддерживающей ее агента Operator. Этот агент способен автономно просматривать веб и использовать определенное программное обеспечение в облачной виртуальной машине для выполнения запросов пользователей.
Об этом сообщает ProIT
В ближайшее время Operator будет использовать модель на основе o3, одной из последних в серии моделей «reasoning» компании OpenAI. Ранее агент базировался на кастомизированной версии GPT-4o.
Согласно многим критериям, o3 является значительно более продвинутой моделью, особенно в задачах, требующих математических расчетов и логического мышления.
«Мы заменяем существующую модель на основе GPT‑4o для Operator на версию, основанную на OpenAI o3», — говорится в блоге OpenAI. «API-версия [Operator] останется на основе 4o».
Operator является лишь одним из многих агентов, которые были представлены компаниями в сфере искусственного интеллекта в последние месяцы. Компании соревнуются в создании высококлассных агентов, которые могут надежно выполнять задачи практически без надзора.
Google предлагает агент для «использования компьютера» через свой API Gemini, который также может просматривать веб и выполнять действия от имени пользователей, а также предлагает потребительский продукт под названием Mariner. Модели компании Anthropic также способны выполнять компьютерные задачи, включая открытие файлов и навигацию по веб-страницам.
Согласно информации от OpenAI, новая модель Operator, известная как o3 Operator, была «дополнительно настроена с учетом данных безопасности для использования компьютера», включая датасеты, созданные для «обучения модели [OpenAI] границам ее решений по подтверждению и отказу».
OpenAI опубликовала технический отчет, в котором продемонстрирована производительность o3 Operator в специфических оценках безопасности. В сравнении с моделью GPT-4o Operator, o3 Operator менее вероятно откажется выполнять «незаконные» действия и искать чувствительные личные данные, а также менее подвержен влиянию атаки искусственного интеллекта, известной как injection prompt, согласно техническому отчету.
«o3 Operator использует тот же многослойный подход к безопасности, который мы применяли для версии 4o Operator», — отмечает OpenAI в своем блоге. «Хотя o3 Operator наследует возможности кодирования o3, он не имеет нативного доступа к среде кодирования или терминалу».