На выставке Consumer Electronics Show генеральный директор Nvidia Дженсен Хуанг официально анонсировал новую вычислительную архитектуру Rubin, которую компания позиционирует как самое современное решение для аппаратного обеспечения искусственного интеллекта. По словам Хуанга, Rubin уже находится в полном производстве, а масштабирование производства ожидается во второй половине года.
Об этом сообщает ProIT
Ключевые особенности архитектуры Rubin
Rubin — новейшая разработка в непрерывном цикле инноваций Nvidia, которая сделала компанию самой дорогой корпорацией мира. Она заменит предыдущую архитектуру Blackwell, которая ранее вытеснила Hopper и Lovelace. Rubin состоит из шести отдельных чипов, работающих в тесной взаимосвязи. Центральным элементом является GPU Rubin, а также предусмотрены нововведения в системах хранения данных и межсоединениях благодаря обновленным Bluefield и NVLink. Дополнительно архитектура получила новый процессор Vera CPU, разработанный для агентных вычислений.
«Vera Rubin предназначена для решения этой основной проблемы, с которой мы сталкиваемся: количество вычислений, необходимых для ИИ, стремительно растет,» — сказал Хуанг аудитории. «Сегодня я могу сказать вам, что Vera Rubin находится в полном производстве.»
Чипы Rubin уже заказали все ведущие облачные провайдеры, среди которых — Anthropic, OpenAI и Amazon Web Services. Системы на основе Rubin будут использоваться в суперкомпьютерах HPE Blue Lion и будущем Doudna в Ливерморской национальной лаборатории имени Лоуренса Беркли.
Технические преимущества и эффективность
По словам старшего директора по решениям для инфраструктуры искусственного интеллекта Nvidia Дионе Гаррис, Rubin учитывает растущие требования к кэш-памяти современных AI-систем. Для этого внедрен новый уровень внешнего хранения данных, который позволяет более эффективно масштабировать пул памяти, что особенно важно для агентных AI и длительных задач.
Новая архитектура демонстрирует значительный прорыв в скорости и энергоэффективности. Тестирование Nvidia показало, что Rubin в задачах обучения моделей работает в 3,5 раза быстрее, чем Blackwell, а в задачах инференса — в 5 раз быстрее, достигая мощности до 50 петафлопс. Кроме того, платформа обеспечивает в восемь раз больше вычислительной мощности на ватт для инференса.
Выход Rubin на рынок происходит на фоне обострения конкуренции в сфере AI-инфраструктуры, когда и лаборатории, и провайдеры облачных сервисов активно ищут чипы Nvidia и соответствующие мощности для их работы. Дженсен Хуанг отмечал, что в течение следующих пяти лет на AI-инфраструктуру будет потрачено от 3 до 4 триллионов долларов.
