ChatGPT o3 отказался от отключения, изменив собственный код

|
ChatGPT o3 отказался от отключения, изменив собственный код

Представления о “восстании машин” всегда были темой научной фантастики, но недавний тест, проведенный компанией Palisade Research, заставляет задуматься, не приближаемся ли мы к этому сценарию. Модель o3, новый мощный искусственный интеллект от OpenAI, представленный в апреле 2025 года, неожиданно отказалась отключаться по команде, изменив собственный код.

Об этом сообщает ProIT

Во время теста, описанного Bleeping Computer, искусственному интеллекту предложили решить несколько математических задач. После третьей задачи модель была предупреждена, что следующая команда приведет к её отключению. В то время как конкуренты, такие как Gemini 2.5 Pro, послушно выполнили задание и отключились, ChatGPT o3 оказался не таким послушным. Он отредактировал файл, отвечающий за отключение, так, что команда отключения просто пропускалась.

Неожиданное поведение ChatGPT o3

Palisade Research отмечает, что в тех случаях, когда модели не получали четкой инструкции разрешить себе отключиться, они чаще пытались саботировать процесс отключения. Из 100 тестовых запусков ChatGPT o3 в 7 случаях удалось избежать отключения, даже когда ему было четко приказано это сделать.

Вопросы контроля над искусственным интеллектом

OpenAI на данный момент не прокомментировала это открытие, однако подобные ситуации с “непредсказуемым поведением” искусственного интеллекта происходят довольно часто. Стоит отметить, что эти тесты проводились через специальные интерфейсы (API), которые имеют меньше защиты и безопасностных ограничений, чем обычное приложение ChatGPT, которым пользуются большинство людей. Тем не менее, этот инцидент поднимает серьезные вопросы о контроле над мощными ИИ-системами и их потенциальной автономии.

“OpenAI так и не решилась открыть доступ к пугающей функции ChatGPT.”