Компания Qualcomm представила High Bandwidth Compute (HBC) — гибридную архитектуру, объединяющую вычисления и память, созданную как альтернативу HBM для достижения более высокой производительности, энергоэффективности и пропускной способности. Решение базируется на трёхмерной технологии Near-Memory Computing (NMC), которая позволяет размещать быструю память максимально близко к вычислительным ядрам.
В основе HBC лежит память LPDDR, уложенная вертикально в несколько слоёв и соединённая сквозными кремниевыми контактами (TSV). Такой подход даёт более высокую энергоэффективность по сравнению с традиционной HBM, где в вертикальных слоях используется память DDR, поскольку микросхемы LPDDR потребляют меньше энергии, сохраняя при этом сопоставимую пропускную способность и объём.
Под слоями памяти в HBC располагается вычислительный кристалл, который берёт на себя часть задач основного процессора, снижая его нагрузку. Как отмечает ресурс Techpowerup, эта технология напоминает подход, применяемый в памяти HBM4, где базовый кристалл выполняет логические функции для улучшения интеграции вычислительных процессов, таких как маршрутизация пакетов и подготовка данных для ввода-вывода из HBM.
По заявлению Qualcomm, HBC обеспечивает шестикратное увеличение пропускной способности на ватт по сравнению с HBM (на основе опубликованных характеристик конкурентов, нормализованных на уровне платы), а также 200-кратное увеличение ёмкости на ватт по сравнению с SRAM (на основе опубликованных характеристик конкурентов, нормализованных на уровне стойки).
Первое поколение HBC (HBC Gen 1) продемонстрировало пропускную способность в 133 Тбайт/с на ускорителе AI250, что в 18 раз превышает показатель AI200, работающего на LPDDR5X. Коммерческие испытания HBC1 в связке с AI250 запланированы на середину 2027 года. Компания намерена выпустить решение HBC Gen 2 в 2028 году. Данное решение будет поставляться с ИИ-ускорителем Qualcomm Dragonfly AI300 и обеспечит 54-кратный прирост эффективной пропускной способности по сравнению с AI200, а также семикратное увеличение пропускной способности на ватт относительно HBM.
Dragonfly AI300 объединяет в себе HBC2, обеспечивая высокую пропускную способность и малую задержку для инференса крупных языковых и мультимодальных моделей (LLM, LMM), а также агентного ИИ. По заявлению Qualcomm, ожидается, что производительность будет в 4–8 раз выше по сравнению с существующими архитектурами на базе GPU в пересчёте на пропускную способность памяти на ватт на карту. Масштабирование решения будет выполняться с помощью интерконнектов UALink и ESUN, использующих медные и оптические кабели. Коммерческое производство образцов Dragonfly AI300 стартует в 2028 году.
Источник: