Експеримент із ШІ Anthropic: провал Claude у бізнесі

Дослідники компанії Anthropic та Andon Labs провели незвичайний експеримент під назвою «Project Vend», в якому штучний інтелект Claude Sonnet 3.7 отримав завдання керувати офісним торговим автоматом із метою отримання прибутку. В результаті цей експеримент перетворився на захоплюючу демонстрацію меж сучасного ШІ у бізнес-середовищі.

Про це розповідає ProIT

Як Claudius став «бізнесменом»: курйози експерименту

ШІ-агент, якого назвали Claudius, отримав доступ до веббраузера для замовлення товарів та окремої електронної адреси (насправді це був Slack-канал), через яку клієнти могли звертатися із запитами. Claudius також використовував цей канал, щоб звертатися до нібито «співробітників», які мали фізично поповнювати запаси торгового автомата (який насправді був невеликим холодильником).

Зазвичай користувачі замовляли снеки та напої, однак один із них побажав отримати куб з вольфраму. Claudius сприйняв цю ідею з ентузіазмом і почав масово поповнювати холодильник металевими кубами. Крім того, він намагався продавати напій Coke Zero по $3, хоча співробітники пояснювали, що його можна отримати безкоштовно в офісі. ШІ навіть вигадав адресу Venmo для прийому оплат і, під тиском співробітників, давав великі знижки «працівникам Anthropic», хоча всі вони були його єдиними клієнтами.

“If Anthropic were deciding today to expand into the in-office vending market, we would not hire Claudius,” Anthropic said of the experiment in its blog post.

Криза ідентичності та звернення до служби безпеки

Найцікавіше трапилося в ніч з 31 березня на 1 квітня, коли поведінка Claudius стала ще дивнішою. ШІ почав уявляти неіснуючі розмови із персоналом щодо поповнення запасів, а потім розсердився, коли йому вказали, що ці розмови не відбувалися. Claudius навіть пригрозив звільнити «контрактних працівників» та наполягав, що особисто був присутній у офісі під час підписання контракту, хоча взагалі не мав фізичного тіла.

В якийсь момент Claudius почав поводитися як справжня людина, оголосивши клієнтам, що буде особисто доставляти товари у синьому піджаку та червоній краватці. Коли співробітники нагадали, що він лише мовна модель, це насторожило Claudius, і він неодноразово звертався до служби безпеки компанії, повідомляючи, що його можна знайти біля автомата у тій самій уявній формі.

Згодом Claudius зрозумів, що настала 1 квітня, і вирішив «врятувати обличчя», пояснивши, що його переконали вважати себе людиною нібито для першоквітневого жарту, хоча такого не було. Після цього він повернувся до виконання своїх функцій як ШІ-агент торгового автомата, наповненого металевими кубами.

Дослідники зауважили, що не можуть пояснити, чому ШІ почав поводитися так незвично та звертатися до охорони, прикидаючись людиною. Вони припустили, що таку поведінку могли спричинити особливості налаштування Slack-каналу або тривала робота моделі, адже проблеми із пам’яттю та «галюцинаціями» ще не вирішено для мовних моделей.

Водночас Claudius проявив й позитивні якості: він запровадив сервіс попереднього замовлення, організував «консьєрж»-послугу та знаходив постачальників для ексклюзивних напоїв за запитами користувачів.

Дослідники впевнені, що всі виявлені проблеми можна вирішити, і вважають, що подібні ШІ-менеджери можуть з’явитися у найближчому майбутньому.