Microsoft презентовала ИИ-чип Maia 200 с 216 ГБ HBM3e и производительностью 10 PFLOPS

|
Microsoft презентовала ИИ-чип Maia 200 с 216 ГБ HBM3e и производительностью 10 PFLOPS

Microsoft объявила о выпуске собственного серверного ИИ-ускорителя второго поколения – Azure Maia 200. Новый чип разработан для высокопроизводительной обработки инференса моделей искусственного интеллекта и позиционируется как самое эффективное решение для инференса в истории компании. По словам разработчиков, Maia 200 обеспечивает на 30% большую производительность на вложенные средства по сравнению с предыдущей версией Maia 100.

Об этом сообщает ProIT

Технические характеристики и архитектура памяти

Maia 200 изготавливается с использованием 3-нм техпроцесса TSMC и содержит впечатляющие 140 миллиардов транзисторов. Чип способен развивать производительность до 10 петафлопс в режиме вычислений FP4, что втрое превышает аналогичный показатель Amazon Trainium3. Новинка оснащена 216 ГБ памяти HBM3e с пропускной способностью 7 ТБ/с и имеет 272 МБ встроенной памяти SRAM.

Особое внимание уделено инновационной архитектуре памяти: SRAM разделена на Cluster-level SRAM (CSRAM) и Tile-level SRAM (TSRAM), что позволяет оптимально распределять нагрузку между HBM и локальной памятью. Такой подход направлен на стабильную и энергоэффективную работу во время обработки задач FP4 и FP8, которые являются критически важными для современных моделей искусственного интеллекта.

Энергоэффективность и внедрение в датацентрах

Несмотря на то, что теплопакет (TDP) Maia 200 составляет 750 Вт – на 50% больше, чем у Maia 100, – Microsoft сообщает о повышении общей энергоэффективности устройства. Для сравнения, Nvidia Blackwell B300 Ultra имеет TDP около 1400 Вт, тогда как Maia 200 потребляет значительно меньше энергии. Предыдущая модель Maia 100 рассчитана на 700 Вт, но фактически работала на уровне 500 Вт.

«Компания позиционирует его как самую эффективную систему инференса, которую она когда-либо разворачивала, и заявляет о 30% более высокой производительности на каждый потраченный доллар по сравнению с Maia 100».

Maia 200 уже внедрён в датацентре Azure US Central. В ближайших планах Microsoft – развертывание этих чипов в регионе US West 3 (Финикс, Аризона) и других центрах в рамках гибридной инфраструктуры, где Maia 200 будет работать вместе с другими ИИ-ускорителями.

Стоит отметить, что прямое сравнение с решениями Nvidia некорректно, так как Maia 200 недоступен для сторонних заказчиков, а экосистема Nvidia значительно более развита. Тем не менее, по уровню энергоэффективности новая разработка Microsoft выглядит довольно перспективно, особенно с учетом актуальных вопросов экологичности и рационального энергопотребления в сфере ИИ.

Разработка Maia 200, который ранее имел кодовое название Braga, заняла больше времени, чем планировалось: старт производства был запланирован еще на 2025 год. По предварительной информации, следующее поколение аппаратного обеспечения Microsoft может быть изготовлено уже с применением техпроцесса Intel 18A, от которого отказалась Nvidia.

Microsoft Maia 200 infographic