Американська компанія Anthropic публічно звинуватила три китайські лабораторії штучного інтелекту — DeepSeek, Moonshot AI та MiniMax — у створенні понад 24 тисяч фейкових акаунтів для масового доступу до моделі Claude з метою покращення власних AI-рішень. За даними Anthropic, за допомогою методу «дистиляції» ці лабораторії здійснили понад 16 мільйонів взаємодій із Claude, концентруючись на ключових функціях: агентному мисленні, використанні інструментів та програмуванні.
Про це розповідає ProIT
Масштаби копіювання та інциденти з провідними китайськими лабораторіями
DeepSeek, Moonshot AI та MiniMax застосували різні підходи до використання Claude. Зокрема, DeepSeek здійснила понад 150 тисяч запитів, які, як вважають в Anthropic, були спрямовані на вдосконалення базової логіки й пошук альтернатив цензурним обмеженням. Компанія DeepSeek стала відомою ще торік після випуску відкритої моделі R1, яка за продуктивністю майже зрівнялася з американськими лідерами ринку, але була суттєво дешевшою. Очікується, що незабаром DeepSeek презентує нову модель V4, яка, згідно з чутками, перевершує Claude та ChatGPT у завданнях з програмування.
Moonshot AI провела понад 3,4 мільйона взаємодій, зосередившись на агентному мисленні, створенні інструментів, аналізі даних, розробці агентів для роботи з комп’ютером і комп’ютерному баченні. Минулого місяця фірма представила відкриту модель Kimi K2.5 і нового агента для програмування.
Лабораторія MiniMax здійснила 13 мільйонів звернень, орієнтуючись на програмування з агентною участю, використання інструментів та оркестрацію процесів. За словами Anthropic, MiniMax під час запуску останньої версії Claude спрямувала майже половину свого трафіку на отримання можливостей саме з цієї моделі.
Загострення дебатів щодо експортного контролю AI-чипів
Інцидент із дистиляцією відбувається на тлі активних дискусій у США щодо політики експорту просунутих AI-чипів до китаю, покликаної стримати розвиток штучного інтелекту в цій країні. Минулого місяця адміністрація Трампа дозволила американським компаніям, зокрема Nvidia, постачати високопродуктивні AI-чипи (наприклад, H200) до китаю. Критики вважають, що це рішення може суттєво посилити обчислювальні можливості китайських AI-лабораторій у період гострої глобальної конкуренції у сфері штучного інтелекту.
Дистиляція — це типовий метод навчання, що дозволяє створювати компактніші та дешевші AI-моделі. Проте у випадку з конкурентами, ця технологія фактично дає змогу копіювати інноваційні рішення інших розробників. Раніше цього місяця компанія OpenAI також звинуватила DeepSeek у використанні дистиляції для імітації своїх продуктів.
“Дистиляційні атаки ще раз підкреслюють необхідність експортного контролю: обмеження доступу до чипів стримує як пряме навчання моделей, так і масштаб незаконної дистиляції”, — йдеться у блозі Anthropic.
Голова Silverado Policy Accelerator та співзасновник CrowdStrike Дмитро Алперович зазначає, що такі випадки не стали несподіванкою:
“Вже давно зрозуміло, що частиною швидкого прогресу китайських AI-моделей є крадіжка американських моделей за допомогою дистиляції. Тепер це підтверджено. Це ще один вагомий аргумент відмовити у продажі будь-яких AI-чипів цим компаніям, оскільки це лише сприятиме їхньому розвитку”.
Anthropic наголошує, що дистиляційні атаки не лише підривають позиції США у сфері AI, а й створюють потенційні загрози національній безпеці. Американські компанії впроваджують системи безпеки, які перешкоджають використанню AI для розробки біологічної зброї чи кіберзлочинності. Проте моделі, отримані шляхом незаконної дистиляції, ймовірно, не мають таких захистів, що дає змогу поширювати небезпечні можливості без будь-яких обмежень.
Anthropic також підкреслює, що авторитарні режими можуть застосовувати передові AI-моделі для масових кібератак, кампаній дезінформації та тотального стеження, особливо якщо такі моделі стають відкритими для широкого доступу. Компанія закликає до спільних дій з боку AI-індустрії, хмарних провайдерів і політиків для протидії подібним загрозам та посилення захисту від дистиляційних атак.