Выпуск DeepSeek R2 откладывается: модель с 1,2 трлн параметров бросит вызов GPT-4

|
Выпуск DeepSeek R2 откладывается: модель с 1,2 трлн параметров бросит вызов GPT-4

Китайская компания DeepSeek готовит к запуску новую версию своей искусственно-интеллектуальной модели DeepSeek R2, которая должна стать серьезным конкурентом для ChatGPT и GPT-4. Однако выход обновленной нейросети задерживается, и ее релиз, несмотря на предыдущие планы на август, состоится позже.

Об этом сообщает ProIT

Причины задержки и технические особенности DeepSeek R2

По информации, которую обнародовали инсайдеры, перенос даты запуска DeepSeek R2 связан с ограниченным доступом к мощным вычислительным ресурсам. Из-за экспортных ограничений, которые в настоящее время действуют на поставку графических ускорителей NVIDIA в Китай, разработчики были вынуждены перейти на альтернативу – процессоры Huawei Ascend 910B. Эта аппаратная платформа обеспечивает около 91% эффективности по сравнению с NVIDIA A100, что позволило команде DeepSeek продолжить разработку, хоть и с определенными компромиссами по мощности.

Генеральный директор компании Лян Вэньфэн пока что не удовлетворен уровнем производительности DeepSeek R2 на текущем этапе. Однако существует вероятность, что ситуация улучшится благодаря новой торговой сделке между NVIDIA, AMD и правительством США. Согласно этим договоренностям, компаниям разрешат экспортировать чипы в Китай при условии отчисления 15% от выручки.

Главные преимущества DeepSeek R2 и конкуренция с GPT-4

Согласно неофициальным данным, модель DeepSeek R2 будет содержать 1,2 трлн параметров, что делает ее прямым конкурентом GPT-4, у которой около 1,76 трлн параметров. В то же время, как утверждают источники, процесс обучения DeepSeek R2 обошелся разработчикам на 97% дешевле, чем затраты, которые понесла OpenAI для своей модели. Такой подход позволяет компании DeepSeek предлагать клиентам доступ к API по значительно более низким ценам.

Точную дату релиза DeepSeek R2 пока не объявлено.

Благодаря своим техническим характеристикам и оптимизации затрат, DeepSeek R2 может стать значительным игроком на рынке искусственного интеллекта и усилить конкуренцию среди ведущих разработчиков языковых моделей.