ОС и софт

Arm бросает вызов клиентам: выпустила собственные процессоры для ИИ

Компания Arm анонсировала свой дебютный собственный процессор Arm AGI, созданный для задач агентного искусственного интеллекта в центрах обработки данных и уже готовый к выпуску. Как отмечает The Register, это означает отход от традиционной для Arm бизнес-модели, при которой она лишь лицензировала свои технологии другим компаниям для самостоятельного производства чипов.

«Хочу чётко обозначить: теперь Arm ведёт новый вид бизнеса — мы поставляем готовые процессоры», — заявил генеральный директор компании Рене Хаас (Rene Haas). По его словам, это решение продиктовано запросами клиентов и потребностью отрасли в энергоэффективных CPU-решениях для агентных ИИ-нагрузок в ЦОДах. Исполнительный вице-президент Arm Мохаммед Авад (Mohammed Awad) добавил, что при разработке процессора Arm AGI руководствовались тремя ключевыми принципами: производительность, масштабируемость и эффективность.

 Источник изображений: Arm

Источник изображений: Arm

Флагманский процессор AGI от Arm — это чип SP113012, оснащённый 136 ядрами Neoverse V3 (Poseidon) с тактовой частотой до 3,7 ГГц (базовая частота — 3,2 ГГц). Ядра распределены между двумя чиплетами, произведёнными по 3-нм технологии TSMC. Каждое ядро включает два 128-битных SVE-блока для векторных операций и поддерживает инструкции MMLA с форматами BF16/INT8. Чип обладает 2 МБ кэша L2 на ядро и 128 МБ общего системного кэша (SLC). Он предлагает 96 линий PCIe 6.0 с поддержкой CXL 3.0 (Type). Пропускная способность памяти достигает 6 ГБ/с на ядро при целевой задержке менее 100 нс, а для работы доступно 12 каналов DDR5-8800 (2DPC).

Модель SP113012S, обладающая оптимизированной совокупной стоимостью владения (TCO), обеспечивает несколько увеличенную скорость доступа к памяти — до 6,3 ГБ/с на одно ядро. Модификация SP113012A располагает 64 ядрами, но сохраняет 12 каналов памяти, что повышает пропускную способность до 13 ГБ/с на ядро. Теплопакет (TDP) для всех вариантов процессора фиксирован на уровне 300 Вт. Также поддерживается построение двухсокетных конфигураций. Как отмечает Авад, компания Arm сознательно отказалась от интеграции специализированных ускорителей или функций, которые увеличивают площадь кристалла, но не приносят ощутимой пользы для целевых рабочих задач. «Классические центральные процессоры сталкивались со сложностями при обеспечении совместимости с устаревшим программным обеспечением, — пояснил он. — Мы намеренно избегали добавления того, что не будет… полностью задействовано в сценариях использования данного устройства».

В отличие от решений NVIDIA Vera, инженеры Arm предпочли не реализовывать многопоточность в процессоре, созданном для искусственного интеллекта, поскольку одно ядро — один поток гарантирует более предсказуемое масштабирование быстродействия. Кроме того, в отличие от ряда современных чипов, функции памяти и ввода-вывода интегрированы в тот же кристалл, что и вычислительные блоки, для сокращения задержек. Каждый сокет будет определяться операционной системой как два независимых NUMA-домена.

Одним из ключевых первых заказчиков Arm для данных процессоров станет Meta, выступающая в роли главного партнёра и соразработчика. Компания планирует применять Arm AGI для оптимизации своей инфраструктуры, предназначенной для семейства приложений и совместной работы с ИИ-ускорителями MTIA, что позволит добиться более эффективного управления ресурсами в масштабных системах искусственного интеллекта. «Совместно с Arm мы работали над созданием Arm AGI, чтобы получить производительную вычислительную платформу, которая существенно увеличивает плотность вычислений в наших дата-центрах и поддерживает долгосрочную стратегию развития наших ИИ-систем», — заявил Сантош Джанардан (Santosh Janardhan), руководитель инфраструктурного направления Meta.

В перечень первых клиентов также вошли OpenAI, SAP, Cerebras, Cloudflare, F5, SK Telecom и Rebellions. Они намерены использовать процессор Arm AGI для основных сценариев в агентно-ориентированных вычислительных системах, развёрнутых в облачных и корпоративных средах. Arm ведёт сотрудничество с ведущими производителями OEM- и ODM-оборудования, включая ASRock Rack, Lenovo, QCT и Supermicro. При этом первые системы уже доступны для тестирования, а более широкие поставки ожидаются во второй половине текущего года.

Кроме того, Arm подготовила два типовых проекта серверов: двухузловой (1U2N) вариант в формате OCP высотой 1OU и более традиционный 19-дюймовый вариант 2U2P, оба с воздушным охлаждением. Например, заказчики могут развернуть стойку мощностью 36 кВт с 30 узлами — в сумме это 8160 вычислительных ядер. Компания также протестировала возможность применения более плотной стойки на 200 кВт с жидкостным охлаждением, вмещающей 42 восьмиузловых сервера, что эквивалентно 45 696 ядрам. Для контекста: в процессорных стойках NVIDIA Vera ETL256 помещается лишь 22 528 ядер.

Хаас отметил, что Arm продолжит создавать новые решения для центров обработ данных, обозначив следующие поколения чипов как Arm AGI CPU 2 и Arm AGI CPU 3, как сообщает MarketBeat. Руководитель Arm указал, что деятельность компании в области ИИ для ЦОД может обеспечить общий объём целевого рынка (TAM) около $3 млрд в виде лицензионных отчислений, и что инициатива по разработке процессора Arm AGI потенциально расширит возможности Arm до приблизительно $100 млрд TAM. Согласно оценкам Arm, к концу десятилетия компания может выйти на рынок объёмом свыше $1 трлн, охватывая развёртывание решений от периферийных устройств до облачных платформ.

Пока Meta обратилась за поддержкой к Arm, другие крупные облачные провайдеры всё активнее развивают собственные наработки. Microsoft использует Arm-процессоры Cobalt 200 (132 ядра), AWS — Graviton 5 (192 ядра), Alibaba Cloud — Yitian 710 (128 ядер), а Google — Axion (точное число ядер не разглашается, но не менее 72). Oracle долгое время применяла Arm-процессоры от Ampere Computing и была одним из ключевых инвесторов этой компании, которую впоследствии приобрела SoftBank.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории