Microsoft объявила о запуске своего новейшего чипа — Maia 200, разработанного для значительного ускорения инференса искусственного интеллекта и повышения эффективности работы крупных AI-моделей.
Об этом сообщает ProIT
Maia 200: технические характеристики и преимущества
Maia 200 является преемником Maia 100, выпущенного в 2023 году, и получил существенные технологические усовершенствования. Новый чип имеет более 100 миллиардов транзисторов, способен обеспечить более 10 петафлопс производительности в 4-битной точности и около 5 петафлопс в 8-битном режиме, что значительно превосходит предыдущую версию. Благодаря этим характеристикам Maia 200 может работать с самыми сложными AI-моделями, обеспечивая ощутимый прирост скорости и энергоэффективности.
Инференс в сфере искусственного интеллекта означает выполнение модели на практике, в отличие от её обучения. С ростом масштабов AI-компаний, расходы на инференс стали важной статьей бюджета. Это стимулирует поиск эффективных решений для оптимизации этого процесса.
«В практическом плане один узел Maia 200 может без усилий запускать самые крупные модели сегодняшнего дня, с большим запасом для ещё более крупных моделей в будущем», — заявила компания.
Глобальная конкуренция в сфере AI-чипов
Выпуск Maia 200 отражает тенденцию среди технологических гигантов к разработке собственных чипов, чтобы снизить зависимость от NVIDIA, чьи GPU стали ключевыми для развития AI. Например, Google использует собственные тензорные процессоры TPU, доступные через облачные сервисы, а Amazon недавно представила третье поколение ускорителя AI — Trainium3. Собственные чипы позволяют компаниям снизить затраты на оборудование, разгружая часть вычислений, которые ранее выполняли GPU NVIDIA.
Maia 200 обеспечивает в три раза более высокую производительность FP4 по сравнению с Trainium третьего поколения от Amazon и превосходит седьмое поколение TPU от Google по показателям FP8. Благодаря этому Microsoft существенно укрепляет свои позиции в соревновании за лидерство на рынке AI-вычислений.
Новый чип уже активно используется для поддержки AI-моделей подразделения Superintelligence и чат-бота Copilot. Компания пригласила к сотрудничеству разработчиков, ученых и исследователей искусственного интеллекта, предложив им воспользоваться программным комплектом разработчика Maia 200 для интеграции в собственные проекты.