Nvidia анонсувала архітектуру Rubin для штучного інтелекту

На виставці Consumer Electronics Show генеральний директор Nvidia Дженсен Хуанг офіційно анонсував нову обчислювальну архітектуру Rubin, яку компанія позиціонує як найсучасніше рішення для апаратного забезпечення штучного інтелекту. За словами Хуанга, Rubin вже перебуває у повному виробництві, а масштабування виробництва очікується у другій половині року.

Про це розповідає ProIT

Ключові особливості архітектури Rubin

Rubin — найновіша розробка в безперервному циклі інновацій Nvidia, яка зробила компанію найдорожчою корпорацією світу. Вона замінить попередню архітектуру Blackwell, яка раніше витіснила Hopper та Lovelace. Rubin складається із шести окремих чипів, що працюють у тісній взаємодії. Центральним елементом є GPU Rubin, а також передбачені нововведення у системах зберігання даних і міжз’єднаннях завдяки оновленим Bluefield і NVLink. Додатково архітектура отримала новий процесор Vera CPU, розроблений для агентних обчислень.

“Vera Rubin is designed to address this fundamental challenge that we have: The amount of computation necessary for AI is skyrocketing.” Huang told the audience. “Today, I can tell you that Vera Rubin is in full production.”

Чипи Rubin вже замовили всі провідні хмарні провайдери, серед яких — Anthropic, OpenAI та Amazon Web Services. Системи на основі Rubin будуть використовуватися у суперкомп’ютерах HPE Blue Lion і майбутньому Doudna в Ліверморській національній лабораторії ім. Лоуренса Берклі.

Технічні переваги та ефективність

За словами старшого директора з рішень для інфраструктури штучного інтелекту Nvidia Діона Гарріса, Rubin враховує зростаючі вимоги до кеш-пам’яті сучасних AI-систем. Для цього впроваджено новий рівень зовнішнього зберігання даних, який дозволяє ефективніше масштабувати пул пам’яті, що особливо важливо для агентних AI та тривалих завдань.

Нова архітектура демонструє значний прорив у швидкості та енергоефективності. Тестування Nvidia показало, що Rubin у завданнях навчання моделей працює у 3,5 раза швидше за Blackwell, а у завданнях інференсу — у 5 разів швидше, досягаючи потужності до 50 петафлопсів. Крім того, платформа забезпечує у вісім разів більше обчислювальної потужності на ват для інференсу.

Вихід Rubin на ринок відбувається на тлі загострення конкуренції у сфері AI-інфраструктури, коли і лабораторії, і провайдери хмарних сервісів активно шукають чипи Nvidia та відповідні потужності для їх роботи. Дженсен Хуанг зазначав, що протягом наступних п’яти років на AI-інфраструктуру буде витрачено від 3 до 4 трильйонів доларів.

Nvidia Rubin AI chip architecture