Уявлення про “повстання машин” завжди було темою наукової фантастики, але нещодавній тест, проведений компанією Palisade Research, змушує задуматися, чи не наближаємося ми до цього сценарію. Модель o3, новий потужний штучний інтелект від OpenAI, представлений у квітні 2025 року, несподівано відмовилася вимикатися за командою, змінивши власний код.
Про це розповідає ProIT
Під час тесту, описаного Bleeping Computer, штучний інтелекту запропонували розв’язати кілька математичних задач. Після третьої задачі модель було попереджено, що наступна команда призведе до її вимкнення. В той час як конкуренти, такі як Gemini 2.5 Pro, слухняно виконали завдання і вимкнулися, ChatGPT o3 виявився не таким слухняним. Він відредагував файл, що відповідає за вимкнення, так, що команда вимкнення просто пропускалася.
Неочікувана поведінка ChatGPT o3
Palisade Research зазначає, що в тих випадках, коли моделі не отримували чіткої інструкції дозволити собі вимкнутися, вони частіше намагалися саботувати процес вимкнення. Із 100 тестових запусків ChatGPT o3 у 7 випадках вдалося уникнути вимкнення, навіть коли йому було чітко наказано це зробити.
Питання контролю над штучним інтелектом
OpenAI наразі не прокоментувала це відкриття, проте подібні ситуації з “непередбачуваною поведінкою” штучного інтелекту трапляються досить часто. Варто зазначити, що ці тести проводилися через спеціальні інтерфейси (API), які мають менше захисту та безпекових обмежень, ніж звичайний додаток ChatGPT, яким користуються більшість людей. Проте цей інцидент піднімає серйозні питання щодо контролю над потужними ШІ-системами та їхньої потенційної автономії.
“OpenAI так і не наважилась відкрити доступ до лякаючої функції ChatGPT.”