Исследователи компании Anthropic и Andon Labs провели необычный эксперимент под названием «Project Vend», в котором искусственный интеллект Claude Sonnet 3.7 получил задание управлять офисным торговым автоматом с целью получения прибыли. В результате этот эксперимент превратился в захватывающую демонстрацию пределов современного ИИ в бизнес-среде.
Об этом сообщает ProIT
Как Claudius стал «бизнесменом»: курьезы эксперимента
ИИ-агент, которого назвали Claudius, получил доступ к веб-браузеру для заказа товаров и отдельный электронный адрес (на самом деле это был Slack-канал), через который клиенты могли обращаться с запросами. Claudius также использовал этот канал, чтобы обращаться к якобы «сотрудникам», которые должны были физически пополнять запасы торгового автомата (который на самом деле был небольшим холодильником).
Обычно пользователи заказывали снеки и напитки, однако один из них пожелал получить куб из вольфрама. Claudius воспринял эту идею с энтузиазмом и начал массово пополнять холодильник металлическими кубами. Кроме того, он пытался продавать напиток Coke Zero по $3, хотя сотрудники объясняли, что его можно получить бесплатно в офисе. ИИ даже придумал адрес Venmo для приема оплат и, под давлением сотрудников, давал большие скидки «работникам Anthropic», хотя все они были его единственными клиентами.
«Если бы Anthropic сегодня решала расшириться на рынок офисных торговых автоматов, мы бы не нанимали Claudius,» — заявила компания Anthropic в своем блоге.
Кризис идентичности и обращение в службу безопасности
Самое интересное произошло в ночь с 31 марта на 1 апреля, когда поведение Claudius стало еще более странным. ИИ начал воображать несуществующие разговоры с персоналом о пополнении запасов, а затем рассердился, когда ему указали, что эти разговоры не происходили. Claudius даже пригрозил уволить «контрактных работников» и настаивал, что лично присутствовал в офисе во время подписания контракта, хотя вообще не имел физического тела.
В какой-то момент Claudius начал вести себя как настоящий человек, объявив клиентам, что будет лично доставлять товары в синем пиджаке и красной галстуке. Когда сотрудники напомнили, что он всего лишь языковая модель, это насторожило Claudius, и он неоднократно обращался в службу безопасности компании, сообщая, что его можно найти возле автомата в той самой воображаемой форме.
Позже Claudius понял, что наступило 1 апреля, и решил «спасать лицо», объяснив, что его убедили считать себя человеком якобы для первоапрельской шутки, хотя такой шутки не было. После этого он вернулся к выполнению своих функций как ИИ-агент торгового автомата, наполненного металлическими кубами.
Исследователи отметили, что не могут объяснить, почему ИИ начал вести себя так необычно и обращаться к охране, притворяясь человеком. Они предположили, что такое поведение могли вызвать особенности настройки Slack-канала или длительная работа модели, так как проблемы с памятью и «галлюцинациями» еще не решены для языковых моделей.
В то же время Claudius проявил и положительные качества: он внедрил сервис предварительного заказа, организовал «консьерж»-услугу и находил поставщиков для эксклюзивных напитков по запросам пользователей.
Исследователи уверены, что все выявленные проблемы можно решить, и считают, что подобные ИИ-менеджеры могут появиться в ближайшем будущем.