ОС и софт

Meta представила четыре новых чипа для ИИ: производительность до 10 петафлопс

Корпорация Meta представила сразу четыре новых поколения своих ИИ-ускорителей MTIA (Meta Training and Inference Accelerator). Речь идёт о моделях MTIA 300, 400, 450 и 500: часть из них уже начала внедряться, а развёртывание остальных намечено на текущий и будущий год. Эти чипы предназначены для решения разнообразных задач искусственного интеллекта, в том числе для вывода данных и работы генеративных сервисов.

Напомним, что первый ИИ-процессор MTIA (MTIA 100) был представлен в 2023 году: он включал 128 ядер RISC-V и 128 МБ памяти SRAM. В 2024 году вышло второе поколение, MTIA 200, с возросшей производительностью. Как заявляет Meta, в каждой из четырёх новых разработок основное внимание уделено совершенствованию вычислительной мощности, пропускной способности памяти и общей энергоэффективности.

Источник изображений: Meta

Конструкция ускорителя MTIA 300 построена вокруг одного вычислительного чиплета, двух сетевых чиплетов (NIC) и нескольких модулей памяти HBM. Вычислительный чиплет состоит из массива процессорных элементов (PE), каждый из которых содержит по два векторных ядра RISC-V. Объём памяти HBM достигает 216 ГБ, а её пропускная способность — 6,1 ТБ/с. Заявленная производительность в ИИ-задачах для форматов FP8/МХ8 составляет до 1,2 Петафлопс. Теплопакет (TDP) устройства равен 800 Вт. В чип интегрирован DMA-контроллер для работы с локальной памятью. Этот ускоритель, уже используемый в дата-центрах Meta, оптимизирован под задачи обучения по методологии Rephrase and Respond (R&R).

Следующей ступенью развития является универсальный ускоритель MTIA 400. Он построен на двух вычислительных чиплетах и оснащён памятью HBM объёмом до 288 ГБ с пропускной способностью 9,2 ТБ/с. Производительность этого решения в операциях FP8/МХ8 достигает 6 Петафлопс. Тепловыделение (TDP) составляет 1200 Вт. Стойка, объединяющая 72 таких ускорителя через коммутационную плату, формирует масштабируемый вычислительный кластер. Для охлаждения может применяться гибридная жидкостно-воздушная система или полностью жидкостное решение. Компания Meta уже завершила тестирование MTIA 400 и приступила к его развёртыванию.

Модель MTIA 450, в свою очередь, предназначена для задач генеративного искусственного интеллекта, в частности для инференса. Этот ускоритель также располагает 288 ГБ памяти HBM, но с удвоенной пропускной способностью — 18,4 ТБ/с. Уровень TDP увеличен до 1400 Вт. Его производительность в режимах FP8/МХ8 составляет до 7 Петафлопс, а в режиме МХ4 — до 21 Петафлопс. MTIA 450 также поддерживает смешанные вычисления с пониженной точностью без необходимости дополнительной программной конвертации данных. Внедрение этого устройства в дата-центры Meta запланировано на начало 2027 года.

Наиболее производительной в линейке является готовящаяся модель MTIA 500, также ориентированная на инференс для генеративного ИИ. Она использует конфигурацию вычислительных чиплетов 2×2, которые окружены несколькими модулями HBM и двумя сетевыми чиплетами. Объём памяти HBM в этом решении варьируется от 384 до 512 ГБ при пропускной способности до 27,6 ТБ/с. Тепловыделение достигает 1700 Вт. Заявленная производительность: до 10 Петафлопс для FP8/МХ8 и до 30 Петафлопс для МХ4. Широкое внедрение MTIA 500 ожидается в 2027 году.

На системном уровне модели MTIA 400, 450 и 500 используют общее шасси, стойку и сетевую архитектуру. Такой подход позволяет проводить модернизацию инфраструктуры с минимальными затратами при переходе на устройства нового поколения.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории