Microsoft оголосила про випуск власного серверного ШІ-прискорювача другого покоління – Azure Maia 200. Новий чип розроблений для високопродуктивної обробки інференсу моделей штучного інтелекту та позиціонується як найефективніше рішення для інференсу в історії компанії. За словами розробників, Maia 200 забезпечує на 30% більшу продуктивність на вкладені кошти порівняно з попередньою версією Maia 100.
Про це розповідає ProIT
Технічні характеристики та архітектура пам’яті
Maia 200 виготовляється з використанням 3-нм техпроцесу TSMC та містить вражаючі 140 мільярдів транзисторів. Чип здатен розвивати продуктивність до 10 петафлопс у режимі обчислень FP4, що утричі перевищує аналогічний показник Amazon Trainium3. Новинка оснащена 216 ГБ пам’яті HBM3e з пропускною здатністю 7 ТБ/с і має 272 МБ вбудованої пам’яті SRAM.
Особливу увагу приділено інноваційній архітектурі пам’яті: SRAM розділена на Cluster-level SRAM (CSRAM) і Tile-level SRAM (TSRAM), що дозволяє оптимально розподіляти навантаження між HBM та локальною пам’яттю. Такий підхід спрямований на стабільну та енергоефективну роботу під час обробки завдань FP4 і FP8, які є критично важливими для сучасних моделей штучного інтелекту.
Енергоефективність та впровадження в датацентрах
Незважаючи на те, що теплопакет (TDP) Maia 200 становить 750 Вт – на 50% більше, ніж у Maia 100, – Microsoft повідомляє про підвищення загальної енергоефективності пристрою. Для порівняння, Nvidia Blackwell B300 Ultra має TDP близько 1400 Вт, тоді як Maia 200 витрачає значно менше енергії. Попередня модель Maia 100 розрахована на 700 Вт, але фактично працювала на рівні 500 Вт.
“Компанія позиціонує його як найефективнішу систему інференсу, яку вона коли-небудь розгортала, і заявляє про 30% вищу продуктивність на кожен витрачений долар порівняно з Maia 100”.
Maia 200 вже впроваджено в датацентрі Azure US Central. У найближчих планах Microsoft – розгортання цих чипів у регіоні US West 3 (Фінікс, Аризона) та інших центрах у межах гібридної інфраструктури, де Maia 200 працюватиме разом з іншими ШІ-прискорювачами.
Варто зазначити, що пряме порівняння з рішеннями Nvidia некоректне, адже Maia 200 не доступний для сторонніх замовників, а екосистема Nvidia значно розвиненіша. Втім, за рівнем енергоефективності нова розробка Microsoft виглядає доволі перспективно, особливо з огляду на актуальні питання екологічності та раціонального енергоспоживання у сфері ШІ.
Розробка Maia 200, який раніше мав кодову назву Braga, тривала довше, ніж планувалося: старт виробництва був запланований ще на 2025 рік. За попередньою інформацією, наступне покоління апаратного забезпечення Microsoft може бути виготовлене вже із застосуванням техпроцесу Intel 18A, від якого відмовилася Nvidia.
