NVIDIA Rubin Ultra: Перший GPU з 1 ТБ пам'яті для дата-центрів

NVIDIA презентувала нову платформу для дата-центрів — Rubin Ultra. Це перший у галузі графічний процесор, який оснащується терабайтом надшвидкої пам’яті HBM4E. Новий чіп використовує чотири обчислювальні чіплети та створений для масштабованих AI-систем нового покоління.

Про це розповідає ProIT

Інноваційна архітектура та технічні особливості Rubin Ultra

Офіційний реліз Rubin Ultra заплановано на 2027 рік. Платформа базується на архітектурі rack-scale Kyber, яка дозволяє об’єднувати до 144 GPU-пакетів в одному серверному рішенні. Завдяки цьому продуктивність значно перевищує поточні системи на кшталт NVL72. Чіплетна структура Rubin Ultra також використовує новий тип упаковки, хоча детальна реалізація поки не розголошується — кристал GPU прихований під теплорозподільником. Не підтверджено й завершення стадії tape-out.

Важливою особливістю є компактний розмір пакета, що може вказувати на застосування стекової архітектури. Tray-рішення Rubin Ultra майже не містить кабелів, що суттєво спрощує складання серверів і, ймовірно, змінює підходи до співпраці з партнерами: NVIDIA може постачати готові модулі, залишаючи партнерам лише інтеграцію у rack-системи.

Rubin Ultra від NVIDIA: перший чіп для GPU з 1 ТБ пам'яті

Kyber: новий стандарт серверних стійок і масштабування AI

Платформа Rubin Ultra впроваджує оновлену архітектуру серверних стійок Kyber із вертикальним розміщенням tray-модулів та рідинним охолодженням за замовчуванням. Це дозволяє розміщувати 144 GPU-пакети на одну стійку. Нові системи Kyber NVL144 у чотири рази перевищують продуктивність Oberon NVL72, оскільки подвоюється як кількість чіплетів у пакеті, так і загальна кількість пакетів у стійці. Оновлений комутатор NVLink сьомого покоління зберігає швидкість 3600 ГБ/с, але дає змогу підвищити масштабованість і число GPU.

Для прискорення масштабованих міжсерверних комунікацій NVIDIA також анонсувала Ethernet-процесор CX9-1600G. Дорожня карта компанії передбачає побудову великих кластерів на основі Rubin Ultra: система NVL576 може поєднувати до 576 GPU та понад 12 тисяч CPU-ядер, досягаючи пікової продуктивності до 15 екзафлопс (FP4) і пропускної здатності міжз’єднань до 1,5 ПБ/с. Це відкриває можливості для створення потужних AI-фабрик, здатних обробляти гігантські моделі та багатокомпонентні системи всередині одного дата-центру.

Rubin Ultra від NVIDIA: перший чіп для GPU з 1 ТБ пам'яті

Окрему увагу приділено інтеграції GPU з Arm-процесорами Vera, які мають 88 ядер і підтримують NVLink-C2C із пропускною здатністю до 1,8 ТБ/с. Це дозволяє суттєво скоротити затримки при виконанні завдань штучного інтелекту. У попередньому поколінні Rubin заявлялася пропускна здатність пам’яті до 22 ТБ/с і продуктивність на рівні 50 PFLOPS (FP4) на чіп, що слугуватиме основою для подальшого масштабування Ultra-версії з чотирма кристалами та HBM4e.

“На тлі оголошень про чіп СЕО NVIDIA Дженсен Хуанг також заявив, що сукупний портфель замовлень на платформи Blackwell і Vera Rubin до кінця 2027 року сягне $1 трлн доларів — удвічі більше за торішній прогноз у $500 млрд. За останні 11 кварталів поспіль NVIDIA фіксує зростання виручки понад 55% рік до року; у поточному кварталі очікується стрибок на 77% — до приблизно $78 млрд доларів”.