Amazon активно зміцнює свої позиції на ринку штучного інтелекту, завдяки розробці власних чипів Trainium, які вже впливають на баланс сил у галузі AI та обіцяють знизити собівартість обчислень для клієнтів AWS. Після оголошення генерального директора Amazon Енді Джессі про інвестиційну угоду в $50 млрд з OpenAI, стало очевидно, що Amazon Trainium став ключовим компонентом не лише для OpenAI, а й для таких гігантів, як Anthropic і Apple.
Про це розповідає ProIT
Trainium: прорив у хмарних обчисленнях для AI
Trainium — це спеціалізований AI-чип, розроблений командою AWS, який уже використовується для обслуговування масштабних моделей штучного інтелекту. Особливо популярним він став серед Anthropic, чиї моделі Claude працюють на понад мільйоні чипів Trainium2, що складає більшість з 1,4 млн впроваджених чипів трьох поколінь. Основна перевага Trainium — значно знижена вартість інференсу (запуску моделей для отримання відповідей), яка є однією з головних проблем сучасної AI-індустрії.
У межах нової угоди OpenAI отримає 2 гігавати потужності Trainium, що є безпрецедентним обсягом, враховуючи стрімке зростання попиту на ці чипи з боку Anthropic та власного сервісу Amazon Bedrock. Frontier — новий AI-агент від OpenAI — працюватиме ексклюзивно на AWS, що може стати вирішальним фактором для розвитку бізнесу OpenAI.
“Наша клієнтська база зростає настільки швидко, наскільки ми встигаємо нарощувати потужності”, — наголошує директор лабораторії Кристофер Кінг. “Bedrock може стати таким же масштабним, як EC2”, — додає він, маючи на увазі одну з ключових хмарних платформ AWS.
Технологічні особливості та інфраструктура
Trainium3, представлений у грудні, працює на новітніх Trn3 UltraServers, що дозволяє знизити вартість обчислень до 50% у порівнянні з традиційними хмарними серверами. У поєднанні з Neuron-перемикачами нове покоління чипів забезпечує надзвичайно швидкий обмін даними між процесорами, що суттєво підвищує ефективність та зменшує затримки. Це особливо важливо при роботі з трильйонами токенів щодня.
Amazon також інтегрує інші власні розробки, такі як Graviton (ARM-серверний процесор) та Inferentia (чип для інференсу), які вже були високо оцінені Apple у 2024 році. Компанія дотримується стратегії: побачити, що користується попитом, і запропонувати вигідну внутрішню альтернативу.
Важливою перевагою Trainium стала підтримка PyTorch — популярного фреймворку для розробки AI-моделей. Це значно спрощує міграцію застосунків з рішень Nvidia: достатньо мінімальних змін у коді для переходу на Trainium.
У березні AWS оголосила про партнерство з Cerebras Systems, інтегруючи їхні чипи інференсу для ще більшої продуктивності та низьких затримок у AI-застосуваннях.
Окрім самих чипів, команда AWS проєктує сервери, їхню архітектуру, системи віртуалізації Nitro та вдосконалені рідинні системи охолодження, що дозволяє оптимізувати вартість та продуктивність на всіх рівнях.
Інфраструктура лабораторії та виробництво
Лабораторія AWS розташована в районі The Domain в Остіні, штат Техас — це сучасний офісний простір із виробничою зоною, обладнаною для тестування, збирання та налагодження чипів. Саме тут інженери проводять “bring-up” — активацію та перевірку нових чипів після 18 місяців розробки, тестуючи їх працездатність та вирішуючи непередбачені складнощі.
Серед цікавих особливостей лабораторії — власна зварювальна станція для надточного монтажу компонентів, а також комплекс власних і комерційних систем для діагностики кожної мікросхеми.
Trainium3 виготовляється на заводах TSMC за 3-нм техпроцесом, а частина інших чипів — компанією Marvell. Прототипи спершу мали повітряне охолодження, однак поточна версія використовує рідинне, що забезпечує кращу енергоефективність.
Особливу увагу в лабораторії приділяють “следам” — спеціальним лоткам, у яких розміщуються Trainium, Graviton та допоміжні плати. Саме ці комплекти забезпечують роботу масштабних AI-систем для Anthropic Claude та інших корпоративних клієнтів.
Взаємодія з OpenAI, Anthropic та Apple
Нині найбільші обсяги Trainium2 працюють у проекті Rainier — одному з найбільших AI-кластерів світу, який запущено наприкінці 2025 року і який налічує понад 500 000 чипів для Anthropic. Хоча інженери лабораторії поки мало взаємодіють безпосередньо з OpenAI, у штаб-квартирі вже з гордістю демонструють цитати щодо майбутнього використання Trainium для нових AI-агентів від OpenAI.
Паралельно команда AWS має власний дата-центр для тестування та контролю якості, відокремлений від клієнтських серверних. Тут встановлені усі новітні рішення: Graviton, Trainium3, Nitro. Охолодження — рідинне, із замкненим циклом, що мінімізує екологічний вплив.

Генеральний директор Amazon Енді Джессі особисто контролює хід робіт у цій лабораторії та неодноразово підкреслював успішність Trainium як одного з ключових напрямків бізнесу AWS. Інженери працюють цілодобово, особливо під час запуску нових поколінь чипів, щоб якнайшвидше усунути всі недоліки та забезпечити масове виробництво для дата-центрів.