Асистент зі штучним інтелектом, розроблений китайським стартапом DeepSeek, уперше зміг випередити ChatGPT, ставши найпопулярнішою безкоштовною програмою в App Store у США. Цю інформацію підтвердили дані компанії Sensor Tower.
Про це розповідає ProIT
Про DeepSeek V3 та її можливості
Модель DeepSeek V3 є відкритою та продемонструвала вражаючі результати у ключових тестах, підтвердивши свою здатність конкурувати з провідними технологіями в галузі. Вона продемонструвала «покращення» у виконанні завдань на логічне мислення. Архітектура V3 базується на Mixture-of-Experts (MoE) і включає в себе 671 мільярд параметрів, з яких 37 мільярдів активізуються для кожного токена. Для порівняння, попередня версія V2 мала 236 мільярдів параметрів з активацією 21 мільярда.
Вплив китайського стартапу на ринок штучного інтелекту
Цікаво, що для навчання DeepSeek V3 використовувався кластер, що складається з понад 2000 чіпів Nvidia, тоді як американські компанії зазвичай витрачають мільйони доларів на десятки тисяч чіпів для створення моделей аналогічного розміру.
В останні роки китайські технологічні компанії та стартапи представили безліч моделей штучного інтелекту, проте саме DeepSeek привернула значну увагу на міжнародній арені, викликавши занепокоєння в Кремнієвій долині. Нещодавно компанія випустила у відкритий доступ модель R1, що спонукало OpenAI перевести свою модель o3-mini в безкоштовну версію ChatGPT.
Модель R1 встановила власні рекорди, ставши найпопулярнішою серед завантажень на HuggingFace, перевищивши 100 тисяч завантажень станом на 25 січня. Також нещодавно незалежні аналітики з Chatbot Arena включили моделі V3 та R1 до десятки найкращих за продуктивністю чат-ботів.
DeepSeek представила «думаючу» модель R1, яка є аналогом o1 від OpenAI, але безкоштовно для користувачів.