DeepSeek V3.1: новая модель ИИ с 671 миллиардом параметров и гибридной архитектурой

|
DeepSeek V3.1: новая модель ИИ с 671 миллиардом параметров и гибридной архитектурой

Китайская компания DeepSeek представила усовершенствованную модель искусственного интеллекта DeepSeek V3.1, которая получила 671 миллиард параметров, гибридное мышление и улучшенную эффективность. Новинка была анонсирована всего через две недели после релиза GPT-5 и уже доступна на платформе Hugging Face. Отмечено, что это одна из крупнейших ИИ-систем в мире, хотя ее контекстное окно ограничено 128 тысячами токенов.

Об этом сообщает ProIT

Гибридная архитектура и ключевые особенности DeepSeek V3.1

Модель DeepSeek V3.1 отличается уникальной гибридной структурой, что позволяет сочетать режимы мышления и немышления, изменяя подход к обработке запросов. Для каждого запроса активируются только необходимые части модели, что способствует снижению вычислительных затрат и делает систему привлекательной для разработчиков, которые ценят баланс между мощностью и экономичностью.

  • Гибридный режим мышления: одна модель поддерживает как режим мышления, так и режим немышления, изменяя шаблон диалога.
  • Умный вызов инструментов: оптимизация после обучения обеспечивает лучшую производительность при использовании инструментов и выполнении агентских задач.
  • Повышенная эффективность: DeepSeek-V3.1-Think обеспечивает ответы на уровне DeepSeek-R1-0528, но с большей скоростью реагирования.

Популярность среди разработчиков и экспертная оценка

В последнее время разработчики ИИ из разных стран, в том числе из США, активно создают пользовательские приложения на базе предыдущей версии DeepSeek R1. Это происходит даже на фоне опасений по поводу распространения китайских нарративов и сбора данных пользователей.

«Отраслевые эксперты отмечают, что хотя последний релиз DeepSeek не такой крупный, как появление R1, выпущенной ранее в этом году, он является значительным достижением.»

Основатель и генеральный директор платформы Lightning AI Уильям Фалкон подчеркнул стабильное развитие DeepSeek, указав, что такая динамика может стать серьезным вызовом для OpenAI, если ее предложения с открытым кодом не смогут конкурировать с китайскими аналогами.

DeepSeek V3.1 модель ИИ
DeepSeek V3.1 модель ИИ