DeepSeek V3.1: ИИ с 671 миллиардом параметров и гибридной архитектурой

Китайская компания DeepSeek представила усовершенствованную модель искусственного интеллекта DeepSeek V3.1, которая получила 671 миллиард параметров, гибридное мышление и улучшенную эффективность. Новинка была анонсирована всего через две недели после релиза GPT-5 и уже доступна на платформе Hugging Face. Отмечено, что это одна из крупнейших ИИ-систем в мире, хотя ее контекстное окно ограничено 128 тысячами токенов.

Об этом сообщает ProIT

Гибридная архитектура и ключевые особенности DeepSeek V3.1

Модель DeepSeek V3.1 отличается уникальной гибридной структурой, что позволяет сочетать режимы мышления и немышления, изменяя подход к обработке запросов. Для каждого запроса активируются только необходимые части модели, что способствует снижению вычислительных затрат и делает систему привлекательной для разработчиков, которые ценят баланс между мощностью и экономичностью.

Гибридный режим мышления: одна модель поддерживает как режим мышления, так и режим немышления, изменяя шаблон диалога.
Умный вызов инструментов: оптимизация после обучения обеспечивает лучшую производительность при использовании инструментов и выполнении агентских задач.
Повышенная эффективность: DeepSeek-V3.1-Think обеспечивает ответы на уровне DeepSeek-R1-0528, но с большей скоростью реагирования.

DeepSeek V3.1: новая модель ИИ с 671 миллиардом параметров и гибридной архитектурой

Гибридная архитектура и ключевые особенности DeepSeek V3.1

Популярность среди разработчиков и экспертная оценка