Корпорация Meta✴ представила сразу четыре новых поколения своих ИИ-ускорителей MTIA (Meta✴ Training and Inference Accelerator). Речь идёт о моделях MTIA 300, 400, 450 и 500: часть из них уже начала внедряться, а развёртывание остальных намечено на текущий и будущий год. Эти чипы предназначены для решения разнообразных задач искусственного интеллекта, в том числе для вывода данных и работы генеративных сервисов.
Напомним, что первый ИИ-процессор MTIA (MTIA 100) был представлен в 2023 году: он включал 128 ядер RISC-V и 128 МБ памяти SRAM. В 2024 году вышло второе поколение, MTIA 200, с возросшей производительностью. Как заявляет Meta✴, в каждой из четырёх новых разработок основное внимание уделено совершенствованию вычислительной мощности, пропускной способности памяти и общей энергоэффективности.
Источник изображений: Meta✴
Конструкция ускорителя MTIA 300 построена вокруг одного вычислительного чиплета, двух сетевых чиплетов (NIC) и нескольких модулей памяти HBM. Вычислительный чиплет состоит из массива процессорных элементов (PE), каждый из которых содержит по два векторных ядра RISC-V. Объём памяти HBM достигает 216 ГБ, а её пропускная способность — 6,1 ТБ/с. Заявленная производительность в ИИ-задачах для форматов FP8/МХ8 составляет до 1,2 Петафлопс. Теплопакет (TDP) устройства равен 800 Вт. В чип интегрирован DMA-контроллер для работы с локальной памятью. Этот ускоритель, уже используемый в дата-центрах Meta✴, оптимизирован под задачи обучения по методологии Rephrase and Respond (R&R).
Следующей ступенью развития является универсальный ускоритель MTIA 400. Он построен на двух вычислительных чиплетах и оснащён памятью HBM объёмом до 288 ГБ с пропускной способностью 9,2 ТБ/с. Производительность этого решения в операциях FP8/МХ8 достигает 6 Петафлопс. Тепловыделение (TDP) составляет 1200 Вт. Стойка, объединяющая 72 таких ускорителя через коммутационную плату, формирует масштабируемый вычислительный кластер. Для охлаждения может применяться гибридная жидкостно-воздушная система или полностью жидкостное решение. Компания Meta✴ уже завершила тестирование MTIA 400 и приступила к его развёртыванию.
Модель MTIA 450, в свою очередь, предназначена для задач генеративного искусственного интеллекта, в частности для инференса. Этот ускоритель также располагает 288 ГБ памяти HBM, но с удвоенной пропускной способностью — 18,4 ТБ/с. Уровень TDP увеличен до 1400 Вт. Его производительность в режимах FP8/МХ8 составляет до 7 Петафлопс, а в режиме МХ4 — до 21 Петафлопс. MTIA 450 также поддерживает смешанные вычисления с пониженной точностью без необходимости дополнительной программной конвертации данных. Внедрение этого устройства в дата-центры Meta✴ запланировано на начало 2027 года.
Наиболее производительной в линейке является готовящаяся модель MTIA 500, также ориентированная на инференс для генеративного ИИ. Она использует конфигурацию вычислительных чиплетов 2×2, которые окружены несколькими модулями HBM и двумя сетевыми чиплетами. Объём памяти HBM в этом решении варьируется от 384 до 512 ГБ при пропускной способности до 27,6 ТБ/с. Тепловыделение достигает 1700 Вт. Заявленная производительность: до 10 Петафлопс для FP8/МХ8 и до 30 Петафлопс для МХ4. Широкое внедрение MTIA 500 ожидается в 2027 году.
На системном уровне модели MTIA 400, 450 и 500 используют общее шасси, стойку и сетевую архитектуру. Такой подход позволяет проводить модернизацию инфраструктуры с минимальными затратами при переходе на устройства нового поколения.
Источник: