На мероприятии генеральный директор Nvidia Дженсен Хуанг представил публике новейший графический процессор Rubin. В ходе выступления он продемонстрировал прототип ускорителя Vera Rubin Superchip, где на единой плате размещены инновационный центральный процессор Vera и два масштабных графических чипа Rubin. Подобная интеграция открывает перспективы беспрецедентной производительности для искусственного интеллекта в суперкомпьютерах нового поколения.
Источник изображений: Nvidia
Каждый графический процессор Rubin включает два крупных кристалла с CUDA-ядрами и восемь модулей высокоскоростной памяти HBM4 суммарным объёмом 288 ГБ. Детальные параметры GPU, включая пропускную способность памяти, пока не раскрываются. При этом заявлено, что одиночная система Vera Rubin Superchip демонстрирует производительность в ИИ-вычислениях (FP4) до 100 Петафлопс, что эквивалентно 100 квадриллионам операций ежесекундно.
Центральный процессор Vera, согласно имеющимся данным, будет оснащён 88 ядрами на базе нераскрытой версии архитектуры Arm с поддержкой 176 потоков. Для взаимодействия с графическими процессорами задействован интерфейс NVLink-C2C, обеспечивающий скорость передачи данных до 1,8 ТБ/с. Плата также комплектуется оперативной памятью LPDDR (точная версия не указана, вероятно LPDDR6), что доводит совокупный объём оперативной памяти на одном суперчипе до 2 ТБ.
На основе новых ускорителей Nvidia планирует выпуск разнообразных систем, таких как Compute Tray, в том числе модификацию CPX для работы с обширным контекстом ИИ-моделей. Кроме того, анонсированы готовые серверные стойки Vera Rubin NVL144, обеспечивающие 3,6 Эксафлопс для инференса обученных моделей ИИ (FP4) и 1,2 Эксафлопс для их обучения (FP8).
Это приблизительно в 3,3 раза превышает скорость современных систем GB300 NVL72. Новая система обеспечит совокупную пропускную способность памяти HBM4 на уровне 13 ТБ/с, располагать 75 ТБ высокоскоростной системной памяти, а общая скорость передачи данных через интерфейсы NVLink и CX9 составит 260 ТБ/с и 28,8 ТБ/с соответственно.
Компания Nvidia представила подробности о системе NVL576, построенной на процессорах Rubin Ultra, выход которых запланирован на вторую половину 2027 года. В её состав войдут четыре мощных GPU-чиплета, размещённых на единой подложке, а также 1 ТБ памяти HBM4e. В результате NVL576 сможет достигать производительности до 15 эксафлопс для FP4 и 5 эксафлопс для FP8, располагая до 365 ТБ высокоскоростной системной памяти и поддерживая сетевую пропускную способность до 1,5 ПБ/с благодаря технологии NVLink.
По данным Nvidia, первые опытные образцы Rubin уже направлены в лаборатории компании для тестирования, а серийный выпуск начнётся в 2026 году. Эту архитектуру сменит совершенно новая платформа Feynman, запуск которой ожидается в 2027–2028 годах. Тем не менее, Nvidia пока не демонстрировала реальные чипы на этой платформе — вероятно, на текущий момент они ещё не существуют в виде физических прототипов.