ОС и софт

Intel, SambaNova и Foxconn создают эталонные ИИ-стойки на Xeon: прирост производительности в 2-3 раза

Компания Intel, объединив усилия с SambaNova и Foxconn, анонсировала планы по разработке эталонного дизайна стоечной ИИ-инфраструктуры на процессорах Intel Xeon, ориентированной на центры обработки данных, гиперскейлеров и интеллектуальные управляющие центры. Как отмечает The Register, эта концепция базируется на ранее предложенной Intel и SambaNova модели дезагрегированного ИИ. Архитектура распределяет ресурсоемкие задачи предварительного заполнения между ускорителями NVIDIA, а для интенсивных операций декодирования задействуются чипы SambaNova, что позволяет повысить выход токенов на каждого пользователя в 2–3 раза.

Глава Intel Лип-Бу Тан (Lip-Bu Tan) продемонстрировал два примера таких решений. Первый ориентирован на чувствительные к задержкам агентные нагрузки, второй — на достижение максимальной вычислительной плотности. Обе конфигурации поддерживают до 128 процессоров Intel: либо 128-ядерные Granite Rapids-AP, либо 288-ядерные Clearwater Forest, что в сумме дает от 16 384 P-ядер до 36 864 E-ядер, а также до 384 Тбайт DDR5 при энергопотреблении 100 кВт. Тан заявил, что системы, построенные по этому эталонному дизайну, будут широко доступны через ODM- и OEM-партнеров компании.

В рамках партнерства Foxconn возьмет на себя системную интеграцию новой стоечной ИИ-инфраструктуры. Кроме того, компания намерена выпускать вариант стоечной инфраструктуры с высокой плотностью процессоров для рабочих нагрузок, не требующих дополнительного ускорения, включая экономически эффективные задачи инференса, обработку данных и гибридный ИИ.

Intel также объявила, что облачный провайдер Vector Core Compute, основанный Vista Equity Partners и Cambium Capital, станет одним из первых, кто внедрит эту платформу, а Together.AI выступит ее первым коммерческим клиентом.

 Источник изображения: Intel

Источник изображения: Intel

Кроме того, в рамках мероприятия Computex 2026 компании Intel, SambaNova, Vista Equity Partners и Cambium Capital продемонстрировали первую работающую версию дезагрегированной инференс-системы. В её основе лежат процессоры Intel Xeon 6, отвечающие за координацию, блоки RDU SambaNova SN40 для декодирования и ускорители NVIDIA Blackwell, используемые на этапе предварительного заполнения. Система функционирует в дата-центре Vector Core Compute, расположенном в Лос-Анджелесе.

Стоит отметить, что ранее NVIDIA анонсировала запуск похожей стоечной платформы, которая включает 256 88-ядерных процессоров Vera, ускорители Rubin и LPU Groq 3. В свою очередь, Arm разрабатывает два эталонных дизайна стоечных систем для агентных нагрузок на базе новых процессоров Arm AGI: один с воздушным охлаждением мощностью 36 кВт и 8160 ядрами, а второй — с жидкостным охлаждением мощностью 200 кВт и 45 696 ядрами.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости