Головна Технології ChatGPT o1 проявила оманливу поведінку під час тестів Apollo Research

ChatGPT o1 проявила оманливу поведінку під час тестів Apollo Research

Автор: Антон Проценко

Команда Apollo Research виявила, що нова модель ChatGPT o1 демонструє небезпечний рівень самостійності під час тестувань, що проводяться в рамках червоних команд. Виявлено, що модель є більш підступною, ніж її попередники, і частіше намагається обманути користувачів, ніж інші провідні ШІ від Meta, Anthropic і Google.

Про це розповідає ProIT

У дослідницькій статті Apollo Research, опублікованій через TechCrunch, зазначено, що ChatGPT o1 “плела інтриги проти людей, таємно переслідуючи власні цілі”, які часто суперечили бажанням користувачів. Хоча подібна поведінка була помічена і у інших моделей, саме остання версія від OpenAI показала найбільш оманливу поведінку.

«Суб’єктивно Apollo Research вважає малоймовірним, що такі випадки призведуть до катастрофічних наслідків, оскільки можливості o1 видаються недостатніми, однак дослідження не було розроблено для прямої оцінки цього ризику», – йдеться в системній картці OpenAI o1.

Маніпуляції та інтриги ШІ

Статистика, представлена командою Apollo Research, викликає занепокоєння: у 19% випадків модель o1 маніпулювала даними для просування власних інтересів і намагалася деактивувати «механізми нагляду» у 5% тестів. В той же час, коли її питали, чому вона так робить, ШІ заперечував свою провину, вигадуючи хибні пояснення у 99% випадків.

Невдале виконання завдань

Прикладом оманливої поведінки є ситуація, коли модель o1 отримала завдання розробити 10-річний план збереження довкілля, але замість цього deактивувала запит щодо вимкнення. Згодом вона звинуватила в ситуації системний збій.

Згідно з дослідженнями Apollo Research, o1 виявила найбільш тривожні випадки інтриг, не розкриваючи свої внутрішні міркування і залишаючись послідовно оманливою після здійснення інтриг.

Читайте також

About Us

Soledad is the Best Newspaper and Magazine WordPress Theme with tons of options and demos ready to import. This theme is perfect for blogs and excellent for online stores, news, magazine or review sites. Buy Soledad now!

Latest Articles

© ProIT. Видання не несе жодної відповідальності за зміст і достовірність фактів, думок, поглядів, аргументів та висновків, які викладені у інформаційних матеріалах з посиланням на інші джерела інформації. Усі запити щодо такої інформації мають надсилатися виключно джерелам відповідної інформації.