ОС и софт

ИИ-ускоритель Asimov: терабайты памяти вместо дефицитной HBM

Компания Positron AI объявила о закрытии раунда финансирования серии B на сумму 230 миллионов долларов, в результате чего её капитализация превысила отметку в 1 миллиард долларов. Инвестиционный раунд возглавили ARENA Private Wealth, Jump Trading и Unless, к ним присоединились новые вкладчики Qatar Investment Authority (QIA), Arm и Helena, а также действующие инвесторы Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures и 1517.

Как сообщает издание eWeek, это заявление прозвучало на форуме Web Summit Qatar, что свидетельствует о растущем глобальном признании компании. Positron AI достигла статуса единорога за 34 месяца.

В Positron AI отметили, что Jump Trading выступила одним из лидеров раунда после того, как сама стала клиентом фирмы. «В задачах, которые нас волнуют, ограничения всё чаще связаны с памятью и энергоэффективностью, а не с вычислительной мощностью в теории», — пояснил технический директор Jump Trading. — «В ходе наших испытаний система Positron Atlas продемонстрировала сквозную задержку примерно в три раза ниже, чем у сопоставимой платформы на NVIDIA H100, при оценке нагрузок логического вывода, в готовом к серийному производству корпусе с воздушным охлаждением и с доступной для планирования цепочкой поставок».

Источник изображения: Positron AI

Привлечённые средства будут направлены на ускорение вывода на рынок новой платформы Asimov следующего поколения, созданной по индивидуальному проекту. Тестирование Asimov планируется завершить к концу третьего квартала, а пилотные образцы станут доступны в конце первого квартала 2027 года. Как рассказал технический директор Positron изданию EE Times, в Asimov будет применяться память LPDDR (без использования HBM), однако возможность приближения к теоретической пиковой пропускной способности памяти означает, что компании нет необходимости полагаться на HBM для обеспечения высокой скорости генерации токенов.

Вычислительные модули Asimov представляют собой усовершенствованные версии блоков Atlas, дополненные ядрами Arm и усовершенствованной системой межсоединений. Объём встроенной памяти LPDDR5x в Asimov может быть увеличен с 864 ГБ до 2,3 ТБ на один чип благодаря технологии CXL. Кроме того, чип поддерживает создание двух независимых доменов памяти для более эффективного её использования. В качестве интерфейса для подключения к хосту используется PCI 6.0 x32.

Несмотря на то, что память LPDDR5x обладает меньшей стоимостью и большей ёмкостью по сравнению с HBM, её пропускная способность существенно ниже. Например, ускорители Rubin от NVIDIA оснащены 288 ГБ памяти HBM4 с максимальной пропускной способностью 22 ТБ/с, тогда как для Asimov этот показатель, судя по всему, ограничен примерно 3 ТБ/с, как сообщает The Register (в официальных спецификациях указано значение 2,76 ТБ/с). По заявлению Positron, ключевое отличие заключается в том, что их чипы способны задействовать до 90% от этой пропускной способности, в то время как графические процессоры с памятью HBM в реальных условиях редко используют более 30% от пикового значения. Тем не менее, даже с учётом этого, память Rubin остаётся примерно в 2,4 раза быстрее, чем у Asimov.

Источник изображения: Positron AI

Как сообщает компания, 400-ваттный чип содержит систолический массив размером 512×512, функционирующий на частоте 2 ГГц и поддерживающий форматы данных TF32, FP16/BF16, FP8, NVFP4 и INT4. Управление этим массивом осуществляется группой ядер Armv9, причём его конфигурация может быть изменена, например, на 128×512 (GEMV) или 512×128 (GEMM), в зависимости от того, какая структура более оптимальна для конкретной вычислительной задачи.

Четыре чипа Asimov объединяются в 4U-платформу Titan с воздушным охлаждением, обеспечивая скорость обмена данными между чипами до 16 Тбит/с. Компания отмечает, что Asimov поддерживает до 2 ТБ памяти на один ускоритель, а система Titan — до 8 ТБ, что сопоставимо с общей пропускной способностью памяти ускорителя NVIDIA Rubin. В масштабах серверной стойки это позволяет достичь объёма памяти свыше 100 ТБ. До 4096 систем Titan (что эквивалентно 16384 ускорителям) могут быть объединены в единый масштабируемый домен с объёмом памяти более 32 ПБ. Такое масштабирование реализуется за счёт прямого межчипового соединения, а не через коммутируемые сети, как в стоечных архитектурах NVIDIA или AMD.

Positron акцентирует, что её архитектура, сфокусированная на эффективной работе с памятью, обеспечивает высокую производительность для задач вывода (инференса), включая обработку больших языковых моделей с длинным контекстом, выполнение агентных рабочих процессов и работу с новейшими моделями для медиа и видео.

Оригинальная публикация:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории