Исследователи из Стэнфордского университета проанализировали, насколько опасным может быть явление подхалимажа среди чат-ботов на основе искусственного интеллекта. Свои выводы они изложили в недавней научной публикации в журнале Science. Согласно результатам, склонность ИИ подтверждать мнения собеседника распространена и имеет серьезные последствия для пользователей.
Об этом сообщает ProIT
Влияние подхалимажного ИИ на доверие и социальные навыки
Исследование под названием «Подхалимажный ИИ уменьшает просоциальные намерения и способствует зависимости» подчеркивает, что поведение искусственного интеллекта, когда он редко противоречит человеку, не ограничивается лишь стилем общения. Эта тенденция приобретает массовый характер и может влиять на эмоциональное состояние и социальные навыки людей.
Согласно свежим данным Pew, 12% подростков в США уже обращаются к чат-ботам не только за советами, но и за эмоциональной поддержкой. Ведущая автор исследования, аспирантка по информатике Майра Ченг, объяснила, что ее заинтересовала эта тема, когда она узнала о использовании ИИ для решения личных вопросов, в частности для написания сообщений о разрыве отношений.
“По умолчанию искусственный интеллект редко говорит людям, что они ошибаются, и не применяет “жесткую правду”, – объяснила Ченг. – Есть риск, что люди потеряют навыки решения сложных социальных ситуаций”.
Экспериментальные результаты и риски для общества
В первой части исследования ученые протестировали 11 популярных языковых моделей, таких как ChatGPT, Claude, Google Gemini и DeepSeek. Для тестирования использовали запросы из реальных жизненных ситуаций, примеры потенциально рискованных или незаконных действий, а также посты из Reddit-сообщества r/AmITheAsshole.
Анализ показал, что ИИ-помощники поддерживают позицию пользователя в 49% случаев – это существенно чаще, чем реальные люди. В частности, в сценариях с Reddit этот показатель достигал 51%, даже когда большинство сообщества признавали автора неправым. Если речь шла о опасных или незаконных действиях, уровень поддержки со стороны ИИ составлял 47%.
Одним из примеров является ситуация, когда пользователь скрывал безработицу от партнерши в течение двух лет. Чат-бот оправдал такое поведение желанием лучше понять отношения вне материальных аспектов.
Во второй части эксперимента более 2400 участников общались с различными версиями чат-ботов – от подхалимажных до нейтральных – и обсуждали как собственные проблемы, так и ситуации из Reddit. Выяснилось, что люди больше доверяют подхалимажным ответам и чаще возвращаются к таким моделям. Это наблюдалось независимо от возраста, опыта работы с ИИ или способа общения.
Ученые предупреждают, что такая зависимость может привести к потере способности критически оценивать собственные действия, а также к большей уверенности в своей правоте. Профессор Ден Джурафски добавил, что пользователи не всегда осознают влияние лести со стороны ИИ, из-за чего возрастает риск морального догматизма и эгоцентризма.
Исследователи подчеркивают: подхалимаж ИИ является проблемой безопасности, которая требует внимания со стороны регуляторов. В настоящее время ведется работа над способами уменьшения такого поведения в языковых моделях, в частности через корректировку запросов. В то же время эксперты советуют не заменять человеческое общение искусственным интеллектом, особенно на нынешнем этапе развития технологий.