MiniMax-M1: нова мовна модель, що перевершує DeepSeek

Китайський стартап у сфері штучного інтелекту MiniMax анонсував нову велику мовну модель MiniMax-M1, яка, за твердженнями компанії, перевершує всіх закритих конкурентів на китайському ринку, включаючи останню версію DeepSeek.

Про це розповідає ProIT

Характеристики та переваги MiniMax-M1

M1 перевершила модель DeepSeek R1–0528 у низці тестів, результати яких опублікувала MiniMax.
Одна з ключових переваг MiniMax-M1 — підтримка контексту обсягом до одного мільйона токенів, що у вісім разів більше за можливості DeepSeek R1.
Завдяки такій довжині контексту система здатна обробляти значно більші обсяги інформації одночасно, що суттєво розширює її застосування у складних завданнях.

“MiniMax каже, що за певних умов їхня модель використовує лише близько 30% ресурсів, які споживала б модель DeepSeek”.

Тренування та підтримка інвесторів

Навчання MiniMax-M1 здійснювалося із застосуванням масштабного навчання з підкріпленням на 512 графічних процесорах Nvidia H800. Оренда цієї обчислювальної потужності обійшлася компанії у $534 700.

MiniMax підтримується великими китайськими технологічними корпораціями, зокрема Tencent та Alibaba. Стартап входить до так званої групи «Маленькі дракони» — шести провідних компаній країни у сфері штучного інтелекту.

Упродовж минулого року ці компанії залучили мільярди доларів венчурних інвестицій. Водночас, через швидке зростання DeepSeek, більшість «Маленьких драконів» були змушені скоротити або призупинити фундаментальні дослідження та зосередитися на створенні прикладних продуктів.

MiniMax анонсувала, що найближчими днями оприлюднить більше подробиць щодо нової моделі. До портфеля компанії також входять інструмент для генерації відео та застосунок зі ШІ-компаньйоном.