Microsoft презентувала новий потужний чип Maia 200 для масштабування AI-інференсу

|
Microsoft презентувала новий потужний чип Maia 200 для масштабування AI-інференсу

Microsoft оголосила про запуск свого найсучаснішого чипа — Maia 200, розробленого для значного прискорення інференсу штучного інтелекту та підвищення ефективності роботи великих AI-моделей.

Про це розповідає ProIT

Maia 200: технічні характеристики та переваги

Maia 200 є наступником Maia 100, випущеного у 2023 році, та отримав суттєві технологічні вдосконалення. Новий чип має понад 100 мільярдів транзисторів, здатний забезпечити понад 10 петафлопс продуктивності у 4-бітній точності та близько 5 петафлопс в 8-бітному режимі, що суттєво перевершує попередню версію. Завдяки цим характеристикам Maia 200 може працювати з найскладнішими AI-моделями, забезпечуючи відчутний приріст швидкості та енергоефективності.

Інференс у сфері штучного інтелекту означає виконання моделі на практиці, на відміну від її навчання. Зі зростанням масштабів AI-компаній, витрати на інференс стали важливою статтею бюджету. Це стимулює пошук ефективних рішень для оптимізації цього процесу.

“In practical terms, one Maia 200 node can effortlessly run today’s largest models, with plenty of headroom for even bigger models in the future”, the company said.

Глобальна конкуренція у сфері AI-чипів

Випуск Maia 200 відображає тенденцію серед технологічних гігантів до розробки власних чипів, щоб зменшити залежність від NVIDIA, чиї GPU стали ключовими для розвитку AI. Наприклад, Google використовує власні тензорні процесори TPU, доступні через хмарні сервіси, а Amazon нещодавно представила третє покоління прискорювача AI — Trainium3. Власні чипи дозволяють компаніям знизити витрати на обладнання, розвантажуючи частину обчислень, які раніше виконували GPU NVIDIA.

Maia 200 забезпечує втричі вищу продуктивність FP4 порівняно з Trainium третього покоління від Amazon і перевершує сьоме покоління TPU від Google за показниками FP8. Завдяки цьому Microsoft суттєво посилює свої позиції у змаганні за лідерство на ринку AI-обчислень.

Новий чип уже активно використовується для підтримки AI-моделей підрозділу Superintelligence та чат-бота Copilot. Компанія запросила до співпраці розробників, науковців і дослідників штучного інтелекту, запропонувавши їм скористатися програмним комплектом розробника Maia 200 для інтеграції у власні проєкти.