Intel, SambaNova и Foxconn анонсировали планы по разработке эталонного дизайна стоечной ИИ-инфраструктуры на процессорах Intel Xeon для дата-центров, гиперскейлеров и центров интеллектуального управления.
Как пишет The Register, данная концепция базируется на ранее предложенной Intel и SambaNova архитектуре дезагрегированного ИИ. Такое построение распределяет ресурсоёмкие операции предварительного заполнения между GPU от NVIDIA, а для задач декодирования задействуются ИИ-ускорители SambaNova, что повышает выход токенов на каждого пользователя в 2–3 раза.
Глава Intel Лип-Бу Тан (Lip-Bu Tan) продемонстрировал два варианта таких решений. Один ориентирован на агентные нагрузки с высокими требованиями к задержкам, другой — на достижение максимальной вычислительной плотности.
Источник изображения: Intel
Обе конфигурации поддерживают до 128 процессоров Intel: либо 128-ядерные Intel Granite Rapids Xeon 6, либо 288-ядерные Intel Clearwater Forest Xeon 6+, что в сумме даёт от 16 384 P-ядер до 36 864 E-ядер, а также до 384 Тбайт оперативной памяти DDR5 при энергопотреблении 100 кВт. Тан отметил, что системы на основе этого эталонного дизайна будут широко доступны у ODM- и OEM-партнёров компании.
В рамках партнёрства Foxconn возьмёт на себя системную интеграцию для новой стоечной ИИ-инфраструктуры. Кроме того, компания планирует выпускать вариант стоечной инфраструктуры с высокой плотностью процессоров для рабочих нагрузок, не требующих дополнительного ускорения, включая экономически эффективные задачи инференса, обработку данных и гибридный ИИ.
Intel также сообщила, что облачный провайдер Vector Core Compute, основанный Vista Equity Partners и Cambium Capital, станет одним из первых, кто развернёт эту платформу, а Together.AI — её первым коммерческим клиентом.
Кроме того, на выставке Computex 2026 компании Intel, SambaNova, Vista Equity Partners и Cambium Capital продемонстрировали первую реальную работу дезагрегированной системы инференса. В ней процессоры Intel Xeon 6 отвечают за оркестрацию и выполнение задач, блоки RDU SambaNova SN40 используются для декодирования, а GPU NVIDIA Blackwell — для предварительного заполнения. Система функционирует на базе дата-центра Vector Core Compute в Лос-Анджелесе (штат Калифорния, США).
Стоит отметить, что ранее NVIDIA анонсировала запуск аналогичной стоечной платформы, которая включает 256 процессоров Vera с 88 ядрами каждый, ускорители Rubin и LPU Groq 3.
Arm, в свою очередь, разрабатывает два референсных дизайна стоечных систем для агентных рабочих нагрузок на базе новых процессоров Arm AGI: 36-киловаттную систему с воздушным охлаждением и 8160 ядрами, а также 200-киловаттную систему с жидкостным охлаждением и 45 696 ядрами.
Источник: