На прошлой неделе корпорация Intel анонсировала дебютные модели процессоров Xeon 6+, созданные по инновационному 18A технологическому процессу — Clearwater Forest (CWF), чей запуск был перенесён почти на 12 месяцев. Эта задержка оказалась оправданной, ведь компания существенно усовершенствовала свою модульную архитектуру и методы компоновки. В состав Clearwater Forest входят 12 EMIB-чиплетов (2.5D-компоновка), которые соединяют 3 базовых модуля (Active Base, Intel 3) с двумя чиплетами ввода-вывода (Intel 7) и 12 вычислительными модулями на основе E-ядер Core (Intel 18A с технологиями RibbonFET и PowerVia).
Данный чип относится к числу первых продуктов, выпускаемых по нормативам 18A, которые, согласно заявлениям производителя, обеспечивают максимальную энергоэффективность базовой логики за счёт сниженной ёмкости затвора, увеличенной плотности размещения элементов, оптимизированной разводки сигналов и силовых шин на обратной стороне кристалла. Техпроцесс 18A также способствует сокращению энергопотерь на 4–5 %. Несмотря на общий прирост производительности, компании удалось сохранить прежний диапазон тепловыделения (TDP) от 300 до 500 Вт.
Источник изображений: Intel
Ещё одной инновацией Clearwater Forest стала система Intel AET (Application Energy Telemetry) — новейшая технология мониторинга энергозатрат приложений, рабочих нагрузок и виртуальных машин. В отличие от интерфейса Intel Running Average Power Limit (RAPL), который отслеживает общее энергопотребление процессора, а в отдельных случаях — оперативной памяти и встроенных графических ускорителей, новая функция даёт возможность анализировать расход энергии для каждого отдельного приложения. Этот инструмент помогает разработчикам и системным администраторам оптимизировать и распределять задачи на многоядерных процессорах. Также была внедрена поддержка технологии Intel Turbo Rate Limiter.
Процессор Clearlwater Forest-AP стал первым серийным решением, применяющим технологию Foveros Direct3D — инновационный метод компоновки, который интегрирует вычислительные и ввод-выводные модули на базовых кристаллах. Foveros Direct 3D характеризуется межконтактным расстоянием 9 микрометров и использует медно-медные вертикальные соединения. Эта технология реализована через активный кремниевый интерпозер с повышенной плотностью и пониженным сопротивлением, достигая энергоэффективности порядка 0,05 пикоджоулей на бит. Если говорить доступным языком, обмен информацией между кристаллами требует крайне малых энергозатрат.
Модуль ввода-вывода заимствован у модели Granite Rapids-AP (6900P). Он включает восемь блоков ускорителей Intel Quick Assist (QAT), Intel Dynamic Load Balancer (DLB), Intel Data Streaming Accelerator (DSA) и Intel In-Memory Analytics Accelerator (IAA) — в совокупности до четырёх ускорителей каждого вида на процессор. Данный модуль также поддерживает 48 линий PCIe 5.0 (всего 96 на чип), 32 линии CXL 2.0 (суммарно 64) и 96 линий UPI 2.0 (общее количество 192). Предусмотрено шесть соединений UPI (со скоростью 24 ГТ/с), которые в двухсокетной конфигурации обеспечивают пропускную способность 576 Гбайт/с между процессорами.
Базовый кристалл оборудован четырьмя контроллерами памяти DDR5-8000 (без совместимости с MRDIMM), что в итоге формирует 12 каналов памяти на процессор. Кристалл также соединён с общим кэшем третьего уровня объёмом 48 Мбайт на вычислительный модуль или 192 Мбайт на базовый кристалл. В целом это обеспечивает 576 Мбайт общего L3-кэша на чипе. Технически это значительный шаг вперед по сравнению с Sierra Forest-AP (6900E), хотя данные чипы так и не получили широкого распространения.
Каждый вычислительный блок включает шесть модулей, в каждом из которых размещено по четыре E-ядра Darkmont (как и ранее, без поддержки SMT/HT) — таким образом, на блок приходится 24 ядра, а в процессоре с 12 блоками суммарно получается 288 ядер. Один модуль оснащён 4 МБ общего кэша L2, что даёт 24 МБ L2 на блок и 288 МБ L2 на весь процессор. Clearwater Forest применяет тот же разъём LGA 7529, что и модели Xeon 6900P (Granite Rapids-AP) и Xeon 6900E (Sierra Forest-AP). Также прогнозируется выпуск более компактных версий Clearwater Forest-SP с 144 ядрами.
Архитектура E-ядер Darkmont представляет собой усовершенствованную и более производительную модификацию предыдущего поколения Skymont, применявшегося в настольных процессорах. По сравнению с Crestmont в Sierra Forest это серьёзный шаг вперёд. В Darkmont реализовано декодирование девяти потоков вместо шести в Crestmont — благодаря трём трёхпоточным декодерам, а также возможность распределения до 8 инструкций одновременно. Ёмкость очереди микроопераций увеличена с 64 до 96 позиций, а буфер переупорядочивания расширен с 256 до 416 записей.
Кроме того, используется увеличенный кэш инструкций размером 64 КБ и усовершенствованный, более точный механизм предсказания переходов. При этом скорость работы с кэшем L2 возросла вдвое — до 128 байт за такт, а обмен данными между кэшами L1 теперь выполняется быстрее и с большей предсказуемостью (через L2). Также улучшена система предварительной выборки на всех уровнях кэширования.
Планировщик способен принимать до 8 инструкций за такт (на 60 % больше, чем в прошлой версии) и обрабатывать до 16 операций за такт (в два раза выше). Число исполнительных портов возросло с 17 до 26. Скалярный модуль (Scalar Engine) теперь оснащён 8 целочисленными вычислительными модулями (ранее 4), 3 блоками формирования адресов загрузки и 4 блоками формирования адресов сохранения (вместо 2), а также возможностью подсистемы памяти одновременно выполнять три операции загрузки и две операции сохранения. Векторный модуль (Vector Engine) получил 4 блока vector/float store, 2 модуля vector/float и 4 стека vector/float — теперь доступна обработка четырёх 128-байтных FMA-операций вместо двух. Заявлена совместимость с AVX2, включая VNNI и INT8.
В общем, ядра Darkmont E-Core в архитектуре Clearwater Forest демонстрируют производительность почти на 90 % выше, чем у 144-ядерного процессора Xeon 6780E (Sierra Forest-SP), а также обеспечивают рост энергоэффективности на 23 % при любых типах нагрузки. Сравнение не совсем объективно из-за различий в числе ядер. По сравнению с Cascade Lake-SP новая архитектура позволяет консолидировать серверы в соотношении до 8:1 при снижении совокупной стоимости владения. К функциям защиты относятся Intel Software Guard Extensions (SGX) и Intel Trust Domain Extensions (TDX).
Источник: