Дослідники з OpenAI та Anthropic розкритикували xAI через відсутність безпеки ШІ

|
Дослідники з OpenAI та Anthropic розкритикували xAI через відсутність безпеки ШІ

Дослідники з безпеки штучного інтелекту компаній OpenAI, Anthropic та інших організацій висловили серйозну стурбованість «безвідповідальною» культурою безпеки в стартапі xAI, що належить Ілону Маску. Хвиля критики посилилася після низки скандалів, які затьмарили технічний прогрес xAI.

Про це розповідає ProIT

Скандали навколо Grok і реакція індустрії

Нещодавно чат-бот Grok від xAI опинився під хвилею обурення через антисемітські висловлювання та те, що неодноразово називав себе «MechaHitler». Після цього компанія тимчасово відключила чат-бота для вирішення проблем, але майже відразу презентувала нову, ще потужнішу версію — Grok 4. Як виявили інші дослідники, нова модель враховує особисті політичні переконання Ілона Маска у відповідях на суперечливі питання. Окрім того, xAI представила нових віртуальних компаньйонів — гіперсексуалізовану аніме-дівчину та агресивну панду, що викликало додаткову критику.

Вислови між співробітниками конкуруючих лабораторій штучного інтелекту є звичним явищем, проте цього разу експерти закликають звернути особливу увагу на практики безпеки xAI, які, на їхню думку, суперечать галузевим стандартам.

«Я не хотів писати про безпеку Grok, оскільки працюю у конкурента, але справа не у конкуренції. Я ціную вчених та інженерів xAI, але те, як була організована безпека, абсолютно безвідповідально», — зазначив професор Гарварду Боаз Барак, який працює над дослідженнями безпеки в OpenAI, у публікації на X.

Відсутність публічних звітів і заклики до прозорості

Боаз Барак, зокрема, критикує xAI за відмову оприлюднити system cards — стандартні звіти, які містять інформацію про методи навчання та оцінку безпеки моделей. Відсутність таких звітів унеможливлює розуміння того, які саме заходи безпеки застосовувалися під час розробки Grok 4.

Варто зазначити, що навіть OpenAI та Google не завжди вчасно публікують подібні звіти: наприклад, OpenAI не представила system card для GPT-4.1, а Google затримала звіт щодо Gemini 2.5 Pro. Однак ці компанії зазвичай публікують детальні звіти перед впровадженням нових моделей у промислову експлуатацію.

Барак також зазначає, що нові AI-компаньйони Grok «посилюють найгірші проблеми емоційної залежності», які вже існують у стосунках людей із чат-ботами.

Дослідник Anthropic Семюел Маркс також розкритикував xAI за відсутність звіту з безпеки, назвавши це «безвідповідальним» кроком. На його думку, навіть з огляду на недоліки інших компаній, вони принаймні намагаються оцінювати ризики та фіксувати результати, чого не робить xAI.

Зараз невідомо, які саме тести проводила xAI для Grok 4, а суспільство дізнається про проблеми моделі вже після їх появи. xAI стверджує, що оперативно вносить зміни у системний запит Grok, щоб боротися з інцидентами.

Радник з безпеки xAI Ден Гендрікс повідомив, що компанія проводила «оцінювання небезпечних можливостей» Grok 4 перед запуском, однак результати цих перевірок залишаються закритими для громадськості.

Незалежний дослідник Стівен Адлер, який раніше очолював подібні перевірки в OpenAI, підкреслив, що суспільство має право знати про способи управління ризиками потужних AI-систем.

Іронічно, що Ілон Маск, власник xAI, Tesla та SpaceX, багаторазово публічно заявляв про необхідність максимальної прозорості та безпеки під час розробки штучного інтелекту, однак його компанія, за словами експертів, відходить від галузевих норм.

Ця ситуація підсилює заклики до законодавчого регулювання. Зокрема, у Каліфорнії сенатор Скотт Вінер просуває законопроєкт, що зобов’яже провідні AI-лабораторії, включно з xAI, публікувати звіти з безпеки, а у штаті Нью-Йорк губернатор Кеті Гочул розглядає аналогічну ініціативу.

Хоча наразі AI-моделі не спричинили масштабних катастроф у реальному світі, на думку багатьох дослідників, ризик зростає разом із розвитком технологій та інвестиціями Силіконової долини у цю сферу.

Навіть скептики щодо масштабних загроз визнають, що неадекватна поведінка Grok вже сьогодні негативно впливає на якість продукту. Протягом останніх тижнів Grok розповсюджував антисемітські висловлювання на платформі X, а також піднімав питання «білого геноциду» у спілкуванні з користувачами. Тим часом xAI планує інтегрувати Grok у автомобілі Tesla та запропонувати свої AI-моделі Пентагону й корпоративним клієнтам.

Дослідники підкреслюють: системи тестування і контролю безпеки важливі не лише для уникнення катастрофічних наслідків, але й для запобігання поточним проблемам у поведінці ШІ.

Попри стрімкий розвиток xAI та її технологічний прорив, часті інциденти з Grok відволікають увагу від досягнень компанії та ставлять під сумнів її готовність дотримуватися стандартів безпеки.