DeepSeek V3.1: новая открытая AI-модель на уровне OpenAI и Anthropic

|
DeepSeek V3.1: новая открытая AI-модель на уровне OpenAI и Anthropic

Китайский стартап DeepSeek произвел громкую премьеру на глобальном рынке искусственного интеллекта, представив модель DeepSeek V3.1. Эта нейросеть, насчитывающая 685 миллиардов параметров, стала доступной для загрузки на платформе Hugging Face, открыв новые возможности для пользователей по всему миру без каких-либо геополитических ограничений.

Об этом сообщает ProIT

Технические характеристики и уникальные возможности

  • DeepSeek V3.1 способна обрабатывать контекст, равный примерно 400-страничной книге — до 128 000 токенов в одном запросе.
  • Модель поддерживает различные форматы точности, включая BF16 и экспериментальный FP8, благодаря чему разработчики могут эффективно адаптировать её под свои технические нужды.
  • Гибридная архитектура позволяет сочетать функции чата, программирования и рассуждений без потери производительности.
  • Среди нововведений — четыре специальные токена: токены поиска предоставляют доступ к интернет-ресурсам в реальном времени, а токены рассуждений способствуют выполнению сложных логических операций в пределах самой модели.

Результаты тестирования и конкурентные преимущества

Первые испытания DeepSeek V3.1 подтвердили её высокий уровень: в тесте Aider, который оценивает навыки генерации кода, модель достигла результата 71,6%. По этому показателю DeepSeek V3.1 уверенно вышла на один уровень с лидерами отрасли — системами OpenAI и Anthropic.

«Модель показала 71,6% на бенчмарке Aider, который оценивает способность к написанию кода. Такой показатель ставит DeepSeek V3.1 в один ряд с ведущими системами от OpenAI и Anthropic».

Выход DeepSeek V3.1 произошел после появления таких известных флагманов, как GPT-5 и Claude 4. Однако, несмотря на острую конкуренцию, новинка получила положительные отзывы от сообщества разработчиков — её отметили за технологический прорыв, гибкость и открытый доступ для всех желающих.