Китайська лабораторія штучного інтелекту DeepSeek стала відомою цього тижня, коли її чатбот-аплікація піднялася на вершину чартів Apple App Store та Google Play. Моделі штучного інтелекту DeepSeek, які були навчені за допомогою ефективних обчислювальних технологій, викликали запитання у аналітиків Уолл-стріт і технологів про те, чи зможе США утримати лідерство в гонці ШІ та чи зможе попит на AI-чипи залишатися стабільним.
Про це розповідає ProIT
Історія створення DeepSeek
DeepSeek підтримується компанією High-Flyer Capital Management, китайським кількісним хедж-фондом, який використовує штучний інтелект для прийняття торгових рішень. AI-ентузіаст Лянь Веньфенг став співзасновником High-Flyer у 2015 році. Він, за повідомленнями, почав займатися торгівлею під час навчання в Університеті Чжецзян, заснувавши High-Flyer Capital Management у 2019 році з акцентом на розробку та впровадження алгоритмів ШІ.
У 2023 році High-Flyer започаткував DeepSeek як лабораторію, присвячену дослідженню інструментів ШІ, окремо від своєї фінансової діяльності. Лабораторія вийшла на самостійний ринок під тією ж назвою. З перших днів DeepSeek створив свої власні кластерні центри даних для навчання моделей. Але, як і інші компанії ШІ в Китаї, DeepSeek постраждав від американських експортних заборон на апаратуру.
Моделі DeepSeek
DeepSeek представив свої перші моделі — DeepSeek Coder, DeepSeek LLM та DeepSeek Chat — у листопаді 2023 року. Однак справжню увагу індустрії ШІ привернула нова генерація моделей DeepSeek-V2, випущена минулої весни. DeepSeek-V2, універсальна система аналізу тексту та зображень, продемонструвала відмінні результати в різних бенчмарках, будучи значно дешевшою у використанні порівняно з аналогічними моделями.
DeepSeek-V3, запущена в грудні 2024 року, лише підвищила репутацію компанії. За даними внутрішніх тестів DeepSeek, модель V3 перевершує як завантажувані, відкриті моделі, такі як Llama від Meta, так і закриті моделі, доступ до яких можливий лише через API, наприклад, GPT-4 від OpenAI. Вражаючою є також модель R1 для «міркувань». За словами DeepSeek, вона виконує завдання на рівні моделі o1 від OpenAI за ключовими бенчмарками.
«Ця модель перевіряє сама себе, що дозволяє уникнути деяких пасток, властивих іншим моделям».
Постійно зростаюча популярність DeepSeek вражає, адже в березні компанія перевищила 16,5 мільйона відвідувань. Хоча зафіксоване зниження трафіку на 25% порівняно з лютим, DeepSeek залишається на другому місці за відвідуваністю. Тим не менш, компанія все ще значно поступається ChatGPT, який перевищив 500 мільйонів активних користувачів на тиждень у березні.
Якщо DeepSeek має бізнес-модель, то вона виглядає не зовсім зрозумілою. Компанія ціни свої продукти та послуги значно нижче ринкової вартості, а деякі з них надає безкоштовно. DeepSeek також не залучає інвестицій, незважаючи на великий інтерес венчурних капіталістів. Ефективні досягнення, за твердженням компанії, дозволяють їй зберігати надзвичайну цінову конкурентоспроможність. Проте деякі експерти ставлять під сумнів надані дані.
Попри це, розробники активно використовують моделі DeepSeek, які, хоча й не є відкритими, доступні під ліцензіями, що дозволяють комерційне використання. CEO Hugging Face, платформи, що хостить моделі DeepSeek, заявив, що розробники на Hugging Face створили понад 500 «похідних» моделей R1, які разом набрали 2,5 мільйона завантажень.
Успіх DeepSeek супроводжується контроверсіями. Компанію описують як таку, що «перевертає AI» та «перебільшена». Успіх DeepSeek призвів до зниження ціни акцій Nvidia на 18% у січні та викликав публічну реакцію CEO OpenAI Сема Альтмана. У березні, згідно з повідомленнями, DeepSeek був заборонений на урядових пристроях.
Microsoft оголосила, що DeepSeek доступний на її платформі Azure AI Foundry для підприємств. На запитання про вплив DeepSeek на витрати Meta на AI під час перших квартальних звітів, CEO Марк Цукерберг зазначив, що витрати на AI-інфраструктуру залишаться «стратегічною перевагою». Водночас OpenAI охарактеризувала DeepSeek як «підконтрольний державі» та рекомендувала уряду США розглянути можливість заборони моделей DeepSeek.
На фоні всього цього, майбутнє DeepSeek залишається невизначеним. Очікується покращення моделей, але уряд США, здається, стає все більш обережним через потенційний негативний іноземний вплив.