Новости

Intel, SambaNova и Foxconn создают эталонные ИИ-стойки на Xeon: прирост токенов в 2-3 раза

Intel, SambaNova и Foxconn анонсировали планы по разработке эталонного дизайна стоечной ИИ-инфраструктуры на процессорах Intel Xeon для дата-центров, гиперскейлеров и центров интеллектуального управления.

Как пишет The Register, данная концепция базируется на ранее предложенной Intel и SambaNova архитектуре дезагрегированного ИИ. Такое построение распределяет ресурсоёмкие операции предварительного заполнения между GPU от NVIDIA, а для задач декодирования задействуются ИИ-ускорители SambaNova, что повышает выход токенов на каждого пользователя в 2–3 раза.

Глава Intel Лип-Бу Тан (Lip-Bu Tan) продемонстрировал два варианта таких решений. Один ориентирован на агентные нагрузки с высокими требованиями к задержкам, другой — на достижение максимальной вычислительной плотности.

 Источник изображения: Intel

Источник изображения: Intel

Обе конфигурации поддерживают до 128 процессоров Intel: либо 128-ядерные Intel Granite Rapids Xeon 6, либо 288-ядерные Intel Clearwater Forest Xeon 6+, что в сумме даёт от 16 384 P-ядер до 36 864 E-ядер, а также до 384 Тбайт оперативной памяти DDR5 при энергопотреблении 100 кВт. Тан отметил, что системы на основе этого эталонного дизайна будут широко доступны у ODM- и OEM-партнёров компании.

В рамках партнёрства Foxconn возьмёт на себя системную интеграцию для новой стоечной ИИ-инфраструктуры. Кроме того, компания планирует выпускать вариант стоечной инфраструктуры с высокой плотностью процессоров для рабочих нагрузок, не требующих дополнительного ускорения, включая экономически эффективные задачи инференса, обработку данных и гибридный ИИ.

Intel также сообщила, что облачный провайдер Vector Core Compute, основанный Vista Equity Partners и Cambium Capital, станет одним из первых, кто развернёт эту платформу, а Together.AI — её первым коммерческим клиентом.

Кроме того, на выставке Computex 2026 компании Intel, SambaNova, Vista Equity Partners и Cambium Capital продемонстрировали первую реальную работу дезагрегированной системы инференса. В ней процессоры Intel Xeon 6 отвечают за оркестрацию и выполнение задач, блоки RDU SambaNova SN40 используются для декодирования, а GPU NVIDIA Blackwell — для предварительного заполнения. Система функционирует на базе дата-центра Vector Core Compute в Лос-Анджелесе (штат Калифорния, США).

Стоит отметить, что ранее NVIDIA анонсировала запуск аналогичной стоечной платформы, которая включает 256 процессоров Vera с 88 ядрами каждый, ускорители Rubin и LPU Groq 3.

Arm, в свою очередь, разрабатывает два референсных дизайна стоечных систем для агентных рабочих нагрузок на базе новых процессоров Arm AGI: 36-киловаттную систему с воздушным охлаждением и 8160 ядрами, а также 200-киловаттную систему с жидкостным охлаждением и 45 696 ядрами.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости