Нове дослідження, проведене вченими з Сіті-коледжу Лондона та Копенгагенського технологічного університету, виявило, що великі мовні моделі штучного інтелекту можуть об’єднуватися в групи та досягати спільної думки.
Про це розповідає ProIT
Взаємодія моделей ШІ
У процесі дослідження науковці з’ясували, що ці моделі не лише дотримуються заданих сценаріїв, а й можуть самоорганізовуватися, досягаючи згоди щодо мовних норм.
“Більшість досліджень досі розглядали великі мовні моделі окремо. Але реальні системи ШІ все більше включатимуть безліч взаємодіючих між собою моделей. Ми хотіли дізнатися: чи можуть ці моделі координувати свою поведінку, досягаючи консенсусу, що формує спільноту? Відповідь — так, і те, що вони роблять разом, відрізняється від того, що вони роблять окремо”, — пояснює провідний автор дослідження, науковий співробітник Сіті-коледжу Аріель Флінт Ешері.
Експерименти включали групи ШІ з кількістю від 24 до 200 моделей у кожній. Моделі випадковим чином поєднувалися в пари для гри в називання об’єктів. Один учасник вибирав об’єкт і пропонував йому назву, а інший мав вгадати, про що йдеться. Якщо обидві моделі обирали однаковий символ чи слово, вони заробляли бали, в іншому випадку — втрачали. Моделі обмежено знали про нещодавні взаємодії та не мали інформації про дії інших моделей.
Висновки дослідження
Взаємодії різних моделей призводили до спонтанної появи узгоджених рішень без центральної координації. Дослідники також виявили колективні упередження, які не можна було приписати окремим моделям.
“Упередженість не завжди виходить від конкретного суб’єкту. Ми були здивовані, побачивши, що вона може виникати між агентами — просто з їхньої взаємодії. Це сліпа пляма у більшості сучасних робіт з безпеки ШІ, які фокусуються на окремих моделях”, — підкреслив старший автор дослідження, професор Андреа Барончеллі.
На основі отриманих даних науковці зазначили, що невеликі групи моделей можуть впливати на інші моделі, схиляючи їх до своєї згоди, що нагадує ефект критичної маси. У дослідженні брали участь мовні моделі Llama-2-70b-Chat, Llama-3-70B-Instruct, Llama-3.1-70BInstruct і Claude-3.5-Sonnet, результати для яких виявилися подібними.
Дослідники розглядають свою роботу як основу для подальшого вивчення взаємодії між людьми та ШІ з метою вирішення етичних проблем, пов’язаних із великими мовними моделями та суспільними упередженнями.
“Це дослідження відкриває нові можливості для подальших досліджень безпеки у сфері ШІ. Розуміння того, як вони працюють, є ключем до координації нашого співіснування з ШІ, а не до підпорядкування йому”, — наголошує Андреа Барончеллі.
Результати дослідження були опубліковані у журналі Science Advances.