MiniMax-M1: Новая языковая модель, превосходящая DeepSeek

Китайский стартап в сфере искусственного интеллекта MiniMax анонсировал новую большую языковую модель MiniMax-M1, которая, по утверждениям компании, превосходит всех закрытых конкурентов на китайском рынке, включая последнюю версию DeepSeek.

Об этом сообщает ProIT

Характеристики и преимущества MiniMax-M1

M1 превзошла модель DeepSeek R1–0528 в ряде тестов, результаты которых опубликовала MiniMax.
Одно из ключевых преимуществ MiniMax-M1 — поддержка контекста объемом до одного миллиона токенов, что в восемь раз больше возможностей DeepSeek R1.
Благодаря такой длине контекста система способна обрабатывать значительно большие объемы информации одновременно, что существенно расширяет ее применение в сложных задачах.

«MiniMax утверждает, что при определенных условиях их модель использует лишь около 30% ресурсов, которые потребляла бы модель DeepSeek».

Обучение и поддержка инвесторов

Обучение MiniMax-M1 осуществлялось с применением масштабного обучения с подкреплением на 512 графических процессорах Nvidia H800. Аренда этой вычислительной мощности обошлась компании в $534 700.

MiniMax поддерживается крупными китайскими технологическими корпорациями, в частности Tencent и Alibaba. Стартап входит в так называемую группу «Маленькие драконы» — шести ведущих компаний страны в сфере искусственного интеллекта.

В течение прошлого года эти компании привлекли миллиарды долларов венчурных инвестиций. В то же время, из-за быстрого роста DeepSeek, большинство «Маленьких драконов» были вынуждены сократить или приостановить фундаментальные исследования и сосредоточиться на создании прикладных продуктов.

MiniMax анонсировала, что в ближайшие дни опубликует больше подробностей о новой модели. В портфель компании также входят инструмент для генерации видео и приложение с ИИ-компаньоном.