Випуск DeepSeek R2 відкладається: модель з 1,2 трлн параметрів кине виклик GPT-4

|
Випуск DeepSeek R2 відкладається: модель з 1,2 трлн параметрів кине виклик GPT-4

Китайська компанія DeepSeek готує до запуску нову версію своєї штучно-інтелектуальної моделі DeepSeek R2, яка має стати серйозним конкурентом для ChatGPT та GPT-4. Однак вихід оновленої нейромережі затримується, і її реліз, попри попередні плани на серпень, відбудеться пізніше.

Про це розповідає ProIT

Причини затримки та технічні особливості DeepSeek R2

За інформацією, яку оприлюднили інсайдери, перенесення дати запуску DeepSeek R2 пов’язано з обмеженим доступом до потужних обчислювальних ресурсів. Через експортні обмеження, які нині діють щодо постачання графічних прискорювачів NVIDIA до Китаю, розробники були змушені перейти на альтернативу – процесори Huawei Ascend 910B. Ця апаратна платформа забезпечує близько 91% ефективності у порівнянні з NVIDIA A100, що дозволило команді DeepSeek продовжити розробку, хоч і з певними компромісами щодо потужності.

Генеральний директор компанії Лян Веньфен поки що не задоволений рівнем продуктивності DeepSeek R2 на поточному етапі. Однак, існує ймовірність, що ситуація покращиться завдяки новій торговельній угоді між NVIDIA, AMD та урядом США. Згідно з цими домовленостями, компаніям дозволять експортувати чіпи до Китаю за умови відрахування 15% від виручки.

Головні переваги DeepSeek R2 та конкуренція з GPT-4

Згідно з неофіційними даними, модель DeepSeek R2 міститиме 1,2 трлн параметрів, що робить її прямим конкурентом GPT-4, яка має близько 1,76 трлн параметрів. Водночас, як стверджують джерела, процес навчання DeepSeek R2 обійшовся розробникам на 97% дешевше, ніж витрати, які понесла OpenAI для своєї моделі. Такий підхід дає змогу компанії DeepSeek пропонувати клієнтам доступ до API за значно нижчими цінами.

Точну дату релізу DeepSeek R2 поки не оголошено.

Завдяки своїм технічним характеристикам та оптимізації витрат, DeepSeek R2 може стати суттєвим гравцем на ринку штучного інтелекту та посилити конкуренцію серед провідних розробників мовних моделей.