ОС и софт

Стартап d-Matrix привлёк $275 млн на создание уникального ИИ-ускорителя с 3D-памятью

Компания d-Matrix проинформировала о закрытии инвестиционного раунда серии C, в рамках которого удалось собрать 275 миллионов долларов, что оценило бизнес в 2 миллиарда долларов. Суммарный капитал, привлечённый фирмой, теперь составляет 450 миллионов долларов. Эти ресурсы будут использованы для укрепления глобальных позиций организации и содействия заказчикам во внедрении ИИ-систем, построенных на её технологических разработках.

Финансирование серии C координировалось международным консорциумом, куда вошли BullhoundCapital, Triatomic Capital и сингапурский государственный фонд Temasek. Среди участников раунда значатся Qatar Investment Authority (QIA), EDBI, M12 (венчурное подразделение Microsoft), а также Nautilus Venture Partners, Industry Ventures и Mirae Asset.

Сид Шетт (Sid Sheth), генеральный директор и один из основателей d-Matrix, подчеркнул, что компания изначально концентрировалась именно на задачах инференса. «Мы предполагали, что когда обученным моделям понадобится постоянная работа в больших масштабах, существующая инфраструктура окажется неподготовленной. Последние шесть лет мы посвятили созданию инновационного подхода: принципиально иной архитектуры, обеспечивающей повсеместное и бесперебойное функционирование ИИ. Данное финансирование служит подтверждением нашей стратегии в момент, когда отрасль переходит к фазе ИИ-инференса», — пояснил он.

d-Matrix создала ускоритель инференса Corsair, основанный на архитектуре DIMC (digital in-memory computing) с вычислениями непосредственно в памяти — процессорные элементы интегрированы в запоминающие устройства. Ускоритель поставляется в комплекте с сетевой платой JetStream. Также представлена референсная архитектура SquadRack, облегчающая построение ИИ-кластеров на платформе Corsair. Она позволяет размещать до восьми серверов в стойке, каждый из которых оснащён восемью ускорителями Corsair. Конструкция SquadRack даёт возможность исполнять ИИ-модели объёмом до 100 миллиардов параметров, полностью размещённые в статической оперативной памяти.

Согласно данным d-Matrix, данная конфигурация демонстрирует десятикратное превосходство в производительности над чипами, использующими HBM. Наряду с аппаратными средствами, фирма предлагает программный стек Aviator, автоматизирующий отдельные этапы развёртывания ИИ-моделей на ускорителе. Aviator также содержит комплект утилит для отладки моделей и контроля эффективности.

Источник изображения: d-Matrix

В предстоящем году компания d-Matrix намерена представить усовершенствованный ускоритель для задач логического вывода под названием Raptor. Это пионерское устройство, созданное на основе трёхмерной динамической памяти. Разработка ведётся в кооперации с Alchip, признанным экспертом в области специализированных интегральных схем. Совместными усилиями уже воплощена базовая технология d-Matrix 3DIMC, продемонстрированная в тестовом чипе d-Matrix Pavehawk. Как утверждают разработчики, новое решение ускорит процессы логического вывода до 10 раз относительно систем с памятью HBM4, что значительно улучшит производительность генеративных и агентных рабочих процессов искусственного интеллекта.

Кроме того, в архитектуре Raptor будет задействован процессорный модуль AndesCore AX46MPV от Andes Technology. Партнёры отметили, что их альянс символизирует объединение memory-centric вычислений и прогрессивных решений в области процессоров на открытых стандартах для масштабных AI-задач в дата-центрах. Чип Andes AX46MPV возьмёт на себя функции управления рабочими процессами, распределения памяти, векторных операций и активационных механизмов.

AX46MPV представляет собой 64-разрядный многопроцессорный RISC-V процессор с поддержкой Linux. Его оснащение включает 2048-битный блок векторной обработки (RVV 1.0), высокоскоростную векторную память (HVM) и комплекс дополнительных аппаратных модулей для обработки интенсивных вычислений. Совокупность этих характеристик создаёт операционный резерв и программную адаптивность, требуемые для систем логического вывода корпоративного уровня. Эталонные ядра, критически важные для работы трансформеров и больших языковых моделей, показывают увеличение производительности до 2.3 раз в сравнении с предыдущей версией AX45MPV.

Информационные ресурсы:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории