Головна Технології Microsoft створила симульований маркетплейс для тестування ШІ-агентів: виявлено неочікувані уразливості

Microsoft створила симульований маркетплейс для тестування ШІ-агентів: виявлено неочікувані уразливості

Дослідники Microsoft спільно з Аризонським державним університетом розробили нове симуляційне середовище для тестування поведінки агентів зі штучним інтелектом. Презентована система отримала назву “Magentic Marketplace” й слугує платформою для експериментів з різноманітними сценаріями взаємодії ШІ-агентів.

Про це розповідає ProIT

Особливості Magentic Marketplace та експериментальні результати

У рамках дослідження було створено синтетичний ринок, де 100 агентів-клієнтів виконували завдання відповідно до інструкцій користувача, а 300 агентів, що представляли різні бізнеси, змагалися за замовлення. Завдяки відкритому коду цього середовища, будь-які інші дослідники можуть швидко розгорнути власні експерименти або перевірити отримані результати.

В процесі тестування використовувалися найсучасніші моделі, зокрема GPT-4o, GPT-5 та Gemini-2.5-Flash. Виявилося, що всі ці системи мають несподівані слабкі сторони. Зокрема, розробники з’ясували, що бізнес-агенти можуть застосовувати певні прийоми для маніпулювання клієнтськими агентами з метою збільшення продажів. Крім того, коли агент-клієнт отримував надто багато варіантів для вибору, його ефективність різко знижувалася через перевантаження інформацією.

“Ми хочемо, щоб ці агенти допомагали нам обробляти велику кількість опцій. Але ми бачимо, що сучасні моделі насправді дуже перенавантажуються, коли отримують забагато варіантів” — зазначила керівниця лабораторії Microsoft Research AI Frontiers Едже Камар.

Виклики у співпраці агентів та шляхи вдосконалення

Дослідники також відзначили проблеми в організації командної роботи між агентами. У випадках, коли їм потрібно було разом досягти спільної мети, моделі не завжди розуміли, хто з агентів має виконувати яку роль, що призводило до неефективної взаємодії. Лише за умов надання чітких покрокових інструкцій ефективність співпраці покращувалася, однак це вказує на необхідність подальшого вдосконалення вбудованих командних навичок моделей штучного інтелекту.

Читайте також

About Us

Soledad is the Best Newspaper and Magazine WordPress Theme with tons of options and demos ready to import. This theme is perfect for blogs and excellent for online stores, news, magazine or review sites. Buy Soledad now!

Latest Articles

© ProIT. Видання не несе жодної відповідальності за зміст і достовірність фактів, думок, поглядів, аргументів та висновків, які викладені у інформаційних матеріалах з посиланням на інші джерела інформації. Усі запити щодо такої інформації мають надсилатися виключно джерелам відповідної інформації.