Китайский стартап в сфере искусственного интеллекта MiniMax анонсировал новую большую языковую модель MiniMax-M1, которая, по утверждениям компании, превосходит всех закрытых конкурентов на китайском рынке, включая последнюю версию DeepSeek.
Об этом сообщает ProIT
Характеристики и преимущества MiniMax-M1
- M1 превзошла модель DeepSeek R1–0528 в ряде тестов, результаты которых опубликовала MiniMax.
- Одно из ключевых преимуществ MiniMax-M1 — поддержка контекста объемом до одного миллиона токенов, что в восемь раз больше возможностей DeepSeek R1.
- Благодаря такой длине контекста система способна обрабатывать значительно большие объемы информации одновременно, что существенно расширяет ее применение в сложных задачах.
«MiniMax утверждает, что при определенных условиях их модель использует лишь около 30% ресурсов, которые потребляла бы модель DeepSeek».
Обучение и поддержка инвесторов
Обучение MiniMax-M1 осуществлялось с применением масштабного обучения с подкреплением на 512 графических процессорах Nvidia H800. Аренда этой вычислительной мощности обошлась компании в $534 700.
MiniMax поддерживается крупными китайскими технологическими корпорациями, в частности Tencent и Alibaba. Стартап входит в так называемую группу «Маленькие драконы» — шести ведущих компаний страны в сфере искусственного интеллекта.
В течение прошлого года эти компании привлекли миллиарды долларов венчурных инвестиций. В то же время, из-за быстрого роста DeepSeek, большинство «Маленьких драконов» были вынуждены сократить или приостановить фундаментальные исследования и сосредоточиться на создании прикладных продуктов.
MiniMax анонсировала, что в ближайшие дни опубликует больше подробностей о новой модели. В портфель компании также входят инструмент для генерации видео и приложение с ИИ-компаньоном.