OpenAI випустила нові AI-моделі для логічного мислення

OpenAI презентувала дві нові відкриті моделі штучного інтелекту для логічного мислення — gpt-oss-120b і gpt-oss-20b. Обидві моделі доступні для безкоштовного завантаження на платформі Hugging Face, і компанія описує їх як «сучасні рішення», що демонструють високі результати у порівнянні з іншими відкритими моделями на ринку.

Про це розповідає ProIT

Технічні характеристики нових моделей

gpt-oss-120b: це потужніша модель, яка здатна працювати на одному графічному процесорі Nvidia, що робить її доступною для професійного використання.
gpt-oss-20b: легша версія, яка може запускатися навіть на звичайному ноутбуці з 16 ГБ оперативної пам’яті, що розширює можливості для розробників-ентузіастів.

Це перші відкриті мовні моделі, які OpenAI випустила з часів GPT-2 — тобто за понад п’ять років.

Відкритість, конкуренція та політичний контекст

OpenAI у минулому вже експериментувала з відкритим кодом, але останніми роками компанія робила ставку на закриту модель розробки. Такий підхід дозволив їй побудувати успішний бізнес, продаючи доступ до своїх рішень для підприємств і розробників через API.

Однак директор OpenAI Сем Альтман у січні висловив думку, що компанія «була на хибному боці історії», стримуючи відкритий доступ до своїх технологій. Водночас, на компанію тисне конкуренція з боку китайських AI-лабораторій, таких як DeepSeek, Qwen від Alibaba та Moonshot AI, які вже розробили низку успішних відкритих моделей. До того ж, адміністрація США закликає до ширшого відкриття технологій штучного інтелекту для підтримки американських цінностей на глобальному рівні.

«Повертаючись до 2015 року, місія OpenAI — забезпечити використання AGI на користь усього людства. Саме тому ми раді, що світ зможе розвивати відкриту AI-інфраструктуру, створену у США, засновану на демократичних цінностях, доступну безкоштовно для всіх і на благо суспільства», — зазначив Альтман.

Вихід gpt-oss покликаний посилити позиції компанії у відкритому сегменті та отримати підтримку розробників і уряду США на фоні зростання впливу китайських AI-лабораторій.

Показники роботи нових моделей

OpenAI стверджує, що прагнула створити лідера серед відкритих моделей. На платформі Codeforces (тестування навичок програмування) gpt-oss-120b та gpt-oss-20b отримали 2622 і 2516 балів відповідно, випереджаючи DeepSeek R1, хоча поступаючись закритим моделям o3 та o4-mini.

OpenAI open model Codeforces performance

На складному тесті Humanity’s Last Exam (HLE), який охоплює різноманітні теми, gpt-oss-120b отримала 19%, а gpt-oss-20b — 17,3%. Ці результати перевищують показники провідних відкритих моделей DeepSeek та Qwen, але поступаються закритій моделі o3.

OpenAI open model HLE performance

Водночас, відкриті моделі OpenAI демонструють вищу схильність до «галюцинацій» (вигадування відповідей) у порівнянні з останніми закритими моделями компанії. За тестом PersonQA, gpt-oss-120b та gpt-oss-20b давали некоректні відповіді у 49% і 53% випадків відповідно, що значно вище, ніж у моделі o1 (16%) та o4-mini (36%).

Особливості тренування та використання

Відкриті моделі OpenAI тренувалися за схожими принципами, як і закриті: із використанням архітектури mixture-of-experts (MoE), що дозволяє активувати менше параметрів для кожного запиту (5,1 мільярда для gpt-oss-120b з-поміж загальних 117 мільярдів). Також застосовувався підхід підсиленого навчання з високими обчислювальними ресурсами, щоб навчити моделі правильним і неправильним діям у симульованих середовищах.

Ці моделі оптимізовані для підтримки AI-агентів, здатні виконувати пошук в інтернеті або виконувати код на Python у процесі логічного аналізу. Однак, на відміну від інших рішень OpenAI, gpt-oss-120b та gpt-oss-20b працюють лише з текстом і не можуть генерувати чи обробляти зображення та аудіо.

Моделі виходять під ліцензією Apache 2.0 — однією з найліберальніших, що дозволяє підприємствам комерціалізувати ці рішення без додаткових погоджень чи виплат OpenAI. Водночас компанія не публікує дані, на яких тренувалися моделі, через юридичні ризики, пов’язані з використанням авторських матеріалів.

Запуск нових моделей неодноразово переносився через питання безпеки. OpenAI та сторонні експерти перевіряли, чи можуть моделі бути використані для кіберзлочинів або створення біологічної чи хімічної зброї. У підсумку, було виявлено лише незначне зростання потенціалу в біологічній сфері, але не досягнуто критичного рівня ризику навіть після донавчання.

Попри заявлену перевагу нових відкритих моделей OpenAI серед конкурентів, розробники з нетерпінням очікують виходу DeepSeek R2 та нової відкритої моделі від Superintelligence Lab компанії Meta.