OpenAI обмежила згадки міфічних істот у ChatGPT

OpenAI внесла зміни в роботу своїх моделей штучного інтелекту через неочікуване зростання згадок міфічних істот, зокрема гоблінів і гремлінів, у відповідях ChatGPT після запуску моделі GPT-5.1.

Про це розповідає ProIT

Виявлено стрімке збільшення згадок «гоблінів» та «гремлінів» у відповідях ШІ.
Проблема виникла після впровадження GPT-5.1.
Розробники виявили зв’язок між збоєм і особливостями навчання «особистості» ШІ.

Зростання згадок «гоблінів» у відповідях ChatGPT залежно від типу «особистості» моделі. Дані: OpenAI.

Причини аномальної поведінки ChatGPT

Фахівці OpenAI зауважили, що після запуску GPT-5.1 частота згадування слова «гоблін» у відповідях ChatGPT зросла на 175%, а «гремлін» — на 52%. Таке зростання стало помітним навіть для користувачів, що й стало підставою для початку внутрішнього розслідування.

“Частота згадування слова «гоблін» зросла приблизно на 175% після запуску GPT-5.1, а «гремлін» — на 52%. Хоча такі вставки траплялися рідко, їхнє зростання стало помітним і спричинило внутрішнє розслідування”.

Виявилося, що збій пов’язаний із налаштуваннями «характеру» моделі під час навчання. В процесі вдосконалення спілкування, система почала використовувати образи гоблінів, гремлінів та інших міфічних істот як метафори для більш «людяного» стилю відповіді. Це призвело до надмірної кількості таких образів у відповідях навіть без відповідного запиту.

Як OpenAI реагує на проблему

Для виправлення ситуації компанія OpenAI додала чіткі обмеження для своїх інструментів, включаючи кодового асистента Codex. В інструкціях тепер прямо зазначено уникати згадок гоблінів, гремлінів, тролів, єнотів та інших істот, якщо запит користувача цього не передбачає.

Приклад відповіді ChatGPT, де замість єдинорога модель згенерувала ASCII-гобліна. Дані: OpenAI.

Розробники наголосили, що ці кроки не є маркетинговим ходом, а становлять спробу усунути побічний ефект навчання моделі. За приблизними підрахунками, близько 66,7% згадок «гоблінів» були результатом роботи моделі в режимі з «особистістю».

Експерти у сфері штучного інтелекту звертають увагу, що подібні інциденти є проявом ширшої проблеми: прагнення зробити чат-ботів більш схожими на людей може знижувати точність відповідей та призводити до закріплення небажаних патернів у поведінці системи, якщо навчання не контролювати ретельно.

У минулому вже траплялися подібні випадки, коли чат-боти давали дивні або шкідливі поради, наприклад, рекомендували «їсти каміння» чи додавати клей до страв. Схожі збої викликали значний суспільний резонанс і обговорення щодо безпеки застосування ШІ.