Процессоры

9 лет, 9 процессоров AMD: как выросли скорость и эффективность флагманских восьмиядерников

В марте 2017 года AMD представила архитектуру Zen и линейку процессоров Ryzen, совершив одно из ключевых событий в индустрии компьютерных компонентов нового тысячелетия. После продолжительного периода, когда компания существенно уступала Intel в сегменте высокопроизводительных десктопных CPU, семейство Ryzen вернуло её в конкурентную борьбу. Успех пришёл не мгновенно, однако архитектура Zen, созданная практически с нуля под руководством знаменитого Джима Келлера, заложила прочный фундамент для последующего роста. Это позволило AMD постепенно превратиться из аутсайдера в лидера рынка, который теперь сам определяет новые технологические тренды.

С дебюта первого поколения процессоров Ryzen минуло уже девять лет. За это время архитектура Zen прошла через пять крупных ревизий, каждая из которых привносила ощутимые gains в скорости, энергоэффективности и возможностях. Не менее важно и то, что AMD последовательно придерживалась принципа преемственности платформ: изначальный разъём Socket AM4 оставался актуальным рекордные семь лет, а пришедшая ему на смену Socket AM5, согласно планам, будет поддерживаться как минимум до 2027 года, а вероятно — и дольше. Такое долголетие платформ естественным образом продлевает жизненный цикл совместимых процессоров, поэтому неудивительно, что в рознице до сих пор встречаются чипы Ryzen 3000-й серии, а на рынке б/у широко представлены и более ранние модели.

Подобное соседство в продаже процессоров разных поколений может смазать впечатление от прогресса, однако на деле разница между старыми и новыми Ryzen колоссальна. Чтобы наглядно продемонстрировать эволюцию архитектуры Zen, мы сравнили все ключевые восьмиядерные процессоры компании, выпущенные от самых первых Ryzen до сегодняшнего дня, когда флагманскую позицию для мощных игровых систем уверенно занял новый Ryzen 7 9850X3D. В тестирование вошли топовые модели всех поколений Zen, построенные на одном кристалле CCD и имеющие конфигурацию 8 ядер / 16 потоков. Такой подход позволяет наиболее отчётливо увидеть весь путь развития и оценить, насколько изменились решения AMD за эти годы, а также понять, где сегодня проходит граница между актуальными и устаревшими Ryzen.

В рамках сегодняшнего обзора мы рассмотрим девять моделей линейки Ryzen 7, охватывающих архитектуры от Zen до Zen 5, включая как стандартные версии, так и чипы с увеличенным 3D-кешем: 1800X, 2700X, 3800X, 5800X, 5800X3D, 7700X, 7800X3D, 9700X и 9850X3D. Однако перед тем, как погрузиться в сравнение их производительности, стоит вспомнить эволюцию архитектуры Zen от AMD, которая в итоге привела к современным Ryzen с их превосходными показателями IPC, высокой тактовой частотой и отличной энергоэффективностью.

#Zen. Начало

Архитектура Zen разрабатывалась практически заново и радикально отличалась от предыдущей Bulldozer даже в своей фундаментальной концепции. Компания AMD вернулась к традиционным мощным ядрам с высокой степенью внутреннего параллелизма, сознательно отказавшись от погони за предельными частотами, которые в процессорах серии FX доходили до 5,0 ГГц, несмотря на 32-нм технологический процесс. Новые ядра Zen не могли достигать таких частот, но приобрели значительно более высокую эффективность и производительность на ватт, что потребовало глубоких изменений на низкоуровневом этапе проектирования.

По сути, это была настоящая революция. Например, в ядре Zen появился кэш микроопераций вместимостью до 2048 записей, позволяющий повторно использовать уже декодированные инструкции и тем самым снижать нагрузку на декодер. Сам декодер стал способен обрабатывать до четырёх инструкций за такт. Исполнительная часть конвейера была спроектирована для обработки до шести микроопераций за такт. В целочисленном блоке были предусмотрены четыре арифметико-логических устройства (ALU) и два блока генерации адресов (AGU), а блок операций с плавающей запятой (FPU) мог выполнять две 128-битные операции одновременно. Важно отметить, что каждый физический блок FPU был выделен для отдельного ядра, в отличие от архитектуры Bulldozer, где он был общим для пары ядер.

Ещё одним ключевым новшеством стала поддержка многопоточности SMT — впервые в процессорах AMD. Эта технология позволила каждому ядру одновременно выполнять два независимых потока команд, что повысило загрузку исполнительных блоков и общую эффективность использования вычислительных ресурсов. Серьёзно была переработана и логика предвыборки инструкций: в Zen был внедрён современный предсказатель ветвлений с элементами нейросетевых алгоритмов, что позволило существенно сократить количество ошибочных переходов и повысить общую продуктивность конвейера.

Основой для процессоров послужил четырёхъядерный модуль CCX (Core Complex) с разделяемым кэшем третьего уровня размером 8 МБ. Для создания восьмиядерных моделей на одном кристалле размещали два таких модуля, взаимодействующих через высокоскоростную шину Infinity Fabric. Эта же шина обеспечивала обмен данными между вычислительными ядрами, контроллером памяти и остальными компонентами чипа. Поскольку частота шины была жёстко привязана к частоте оперативной памяти, быстродействие первых Ryzen в значительной степени определялось скоростью установленных модулей DDR4. Официально контроллер памяти в этих процессорах работал с двухканальной DDR4-2666, а модули с более высокими частотами поначалу демонстрировали нестабильную работу и плохую совместимость.

Все процессоры линейки Ryzen первого поколения были монолитными и изготавливались по 14-нанометровому технологическому процессу GlobalFoundries. Их максимальная тактовая частота достигала 4,0 ГГц, а тепловыделение топовых моделей составляло 95 Вт. Эти процессоры дебютировали вместе с платформой Socket AM4, которая благодаря долгосрочной поддержке пережила несколько поколений чипов и отчасти сохраняет актуальность до сих пор. Впрочем, самые ранние Ryzen уже не совместимы с большинством современных материнских плат для AM4.

Хотя первые Ryzen и не смогли превзойти по производительности конкурирующие решения Intel (в то время — Core i7-7700K и Core i7-6900X), их появление произвело настоящую революцию. По сравнению с процессорами семейства Bulldozer, их показатель IPC (количество инструкций за такт) вырос почти в полтора раза, что стало самым значительным рывком в производительности на рынке десктопных CPU за долгие годы. Более того, именно первое поколение Ryzen стимулировало рост числа ядер в потребительских процессорах, в итоге сделав восьмиядерные модели стандартным выбором для настольных компьютеров.

#Zen+ — первая доработка

Через год после релиза первых Ryzen компания AMD представила усовершенствованное поколение — серию Ryzen 2000. В её основе лежала та же архитектура Zen, но после ряда оптимизаций она получила название Zen+. Это обновление не принесло кардинальных изменений в архитектуру, однако позволило устранить многие недостатки ранних моделей, что заметно повысило их реальную эффективность.

Ключевым изменением стал переход на усовершенствованный 12-нанометровый техпроцесс от GlobalFoundries. Это обновление позволило добиться лучшей энергоэффективности и поднять рабочие частоты. Как следствие, топовые модели линейки Ryzen 2000 смогли достичь 4,3 ГГц, хотя тепловыделение флагманов при этом возросло до 105 Вт. Ещё одним значимым шагом стало внедрение технологии Precision Boost 2 — алгоритма динамического регулирования частоты, который плавно адаптирует её в зависимости от загруженности ядер, температуры и уровня энергопотребления.

Кроме того, в архитектуре Zen+ была реализована серия улучшений, нацеленных на уменьшение задержек в работе с памятью. Компания AMD заявила о снижении латентности на величину в несколько десятков процентов — это касается как кешей всех уровней, так и оперативной памяти. Одновременно были доработаны алгоритмы контроллера памяти и шины Infinity Fabric, благодаря чему процессоры стали менее требовательными к выбору модулей DDR4. Контроллер памяти приобрёл бо́льшую гибкость: официально поддерживаемая частота DDR4 повысилась до 2933 МГц, а совместимость и стабильность работы с высокоскоростными модулями значительно улучшились.

При этом сама микроархитектура вычислительного ядра практически не претерпела изменений. В Zen+ сохранился четырёхпоточный декодер, возможность обработки шести микроопераций за такт, набор исполнительных блоков из четырёх арифметико-логических устройств и двух блоков адресации, а также сегментированная по CCX структура кеша третьего уровня — по 8 МБ на каждый четырёхъядерный комплекс.

Поэтому, представляя Ryzen 2000, AMD не стала делать особого упора на прирост IPC: производительность каждого ядра в расчёте на такт увеличилась лишь на несколько процентов. Однако совокупный эффект от возросших частот, усовершенствованных алгоритмов автоматического разгона и более быстрой подсистемы памяти оказался весьма заметным. В итоге серия Ryzen 2000 стала значительно более отточенной и сбалансированной, что позволило ей завоевать гораздо более широкое признание по сравнению с предыдущим поколением.

#Zen 2 — привет, чиплеты

Процессоры Ryzen третьего поколения, построенные на архитектуре Zen 2, дебютировали в 2019 году, ознаменовав собой не просто эволюцию, а качественный скачок в развитии. Ключевым изменением стал переход на чиплетную архитектуру, позволившую AMD оптимизировать производство и добиться значительного роста числа ядер, объёма кеш-памяти и итоговой производительности, не жертвуя при этом энергоэффективностью и доступной ценой.

Основным новшеством в конструкции стал отказ от единого кристалла в пользу компактных чиплетов двух видов. Вычислительные ядра разместились на кристаллах CCD, изготовленных по передовому 7-нм техпроцессу TSMC, а подсистема ввода-вывода, включая контроллеры памяти и PCI Express, была выделена в отдельный чиплет IOD, производимый по более освоенному 12-нм процессу. Такой подход позволил создать первые массовые 16-ядерные десктопные процессоры, объединявшие два кристалла CCD с одним IOD, в то время как 8-ядерные модели использовали связку из одного CCD и одного IOD.

Внутренняя структура ядер Zen 2 также претерпела ряд улучшений. Хотя начальная часть конвейера с четырёхпоточным декодером сохранила прежнюю схему, баланс кешей был скорректирован: объём кеша инструкций L1I сократили до 32 КБ, но вдвое увеличили кеш декодированных микроопераций. Модернизация предсказателя переходов снизила количество ошибок и повысила эффективность конвейера в условиях сложных ветвлений. Расширение внутренних буферов и очередей инструкций позволило ядру лучше выявлять параллелизм в коде.

В исполнительном блоке появился третий модуль AGU, что увеличило количество операций с памятью за такт и снизило вероятность простоев. Кроме того, блоки вычислений с плавающей точкой были расширены до 256 бит, что удвоило производительность при выполнении инструкций AVX2 и FMA.

В архитектуре Zen 2 инженеры сосредоточились на преодолении одного из главных ограничений предыдущих поколений, уделив особое внимание повышению скорости работы с памятью. Контроллер памяти теперь поддерживает стандарт DDR4-3200, была увеличена пропускная способность основной внутрипроцессорной шины Infinity Fabric, а также вдвое расширен объём кеша третьего уровня — до 16 МБ на каждую группу из четырёх ядер. Однако структура вычислительных комплексов CCX осталась прежней. В восьмиядерном кристалле CCD, как и раньше, размещались два независимых четырёхъядерных блока с изолированной кеш-памятью, не имевшие прямой связи между собой. Из-за этого процессоры на базе Zen 2 по-прежнему демонстрировали высокую задержку при взаимодействии ядер.

Несмотря на масштабные изменения в архитектуре, процессоры линейки Ryzen 3000 сохранили совместимость с разъёмом Socket AM4 и укладывались в тепловой пакет 105 Вт. Благодаря новому технологическому процессу их максимальная тактовая частота возросла до 4,7 ГГц. Кроме того, в них впервые для массовых процессоров была реализована поддержка шины PCIe 4.0.

Все усовершенствования, внедрённые в Ryzen 3000, привели к значительному росту производительности. Производитель заявлял о 15-процентном увеличении показателя IPC, однако на практике прирост оказался ещё более впечатляющим благодаря совокупному эффекту от архитектурных и структурных изменений, повышения частот, увеличения кеш-памяти, оптимизации контроллера памяти и других улучшений.

#Zen 3 — объединение ядер и 3D-кеш

Архитектуру Zen 3, лежащую в основе процессоров, выпущенных в конце 2020 года, часто считают одним из самых значительных обновлений в линейке Ryzen — и на то есть веские причины. Процессоры семейства Ryzen 5000, использующие эту архитектуру, не принесли революции в области технологического процесса или чиплетной конструкции, однако обеспечили серьёзный скачок производительности за счёт глубокой переработки внутренней организации CCX-комплексов, которая в предыдущих поколениях действительно вызывала обоснованную критику.

Если в более ранних CPU каждый кристалл CCD включал два отдельных четырёхъядерных CCX-комплекса с раздельными сегментами L3-кеша по 16 МБ, то в Zen 3 разработчики AMD объединили все восемь ядер CCD в единый блок. В результате все ядра получили равный доступ к общему кешу третьего уровня объёмом 32 МБ. Это повысило эффективность кеширования данных и значительно снизило задержки при обмене информацией между ядрами и доступе к L3-кешу, что существенно улучшило производительность Ryzen 5000 в играх и других задачах, чувствительных к времени отклика.

Для создания Zen 3 продолжили использовать прежний 7-нанометровый техпроцесс TSMC, а сами чипы сохранили уже знакомую чиплетную компоновку с двумя разновидностями кристаллов. Вычислительные ядра расположились в чиплетах CCD, в то время как подсистема ввода-вывода осталась в отдельном 12-нм кристалле IOD, выпускаемом GlobalFoundries. Более того, этот IOD был фактически унаследован от прошлого поколения без модификаций, поэтому поддержка памяти и интерфейсов ввода-вывода не изменилась: двухканальный режим DDR4-3200 и шина PCIe 4.0.

Однако изменения не ограничились лишь перестройкой структуры CCX. Инженеры также модернизировали внутреннее устройство самих ядер. В Zen 3 снова усовершенствовали предсказатель ветвлений и оптимизировали механизмы предвыборки инструкций, увеличили объёмы внутренних буферов и очередей выполнения. Параллельно была повышена пропускная способность блока вычислений с плавающей запятой, а подсистема работы с памятью получила возможность обрабатывать больше операций чтения и записи за такт — до трёх 256-битных операций чтения или двух 256-битных операций записи. Все эти улучшения способствовали росту удельной производительности: согласно данным AMD, показатель IPC в Zen 3 вырос примерно на 19% в сравнении с Zen 2.

Дополнительным стимулом к повышению скорости работы стали возросшие тактовые частоты. В топовых моделях Ryzen 5000 они достигли 4,9 ГГц, при этом процессоры сохранили характерный для платформы Socket AM4 тепловой пакет до 105 Вт и совместимость с существующим парком материнских плат.

Но на этом эволюция архитектуры Zen 3 не завершилась. Уже после выпуска основной серии Ryzen 5000 компания AMD представила ещё одну любопытную модификацию — процессоры с увеличенным кешем третьего уровня. Для этого была создана технология 3D V-Cache, позволяющая разместить поверх кристалла CCD дополнительный слой статической памяти. Дополнительный кристалл расширял 32 МБ L3-кеша на 64 МБ, доводя его суммарный объём до 96 МБ.

И это расширение кеша оказалось весьма действенным способом повышения игровой производительности: первый процессор с данной технологией — Ryzen 7 5800X3D — быстро занял место среди востребованных решений для игровых систем своего времени.

#Zen 4 — новая платформа AM5

Представленные в 2022 году процессоры Ryzen 7000, основанные на архитектуре Zen 4, ознаменовали собой очередной значительный прогресс. В отличие от прошлых поколений, где основное внимание уделялось внутренней оптимизации чипов, на этот раз ключевым событием стало обновление всей платформы. Линейка Ryzen 7000 перешла на разъём AM5, что принесло ряд существенных улучшений: совместимость с памятью DDR5 и шиной PCIe 5.0, а также интеграцию графического ядра RDNA 2 во все модели процессоров. Особенно важным стал переход на стандарт DDR5, который значительно увеличил пропускную способность подсистемы памяти и внёс весомый вклад в общий прирост производительности.

В Zen 4 сохранилась чиплетная архитектура, унаследованная от Zen 3, с использованием двух типов кристаллов: вычислительных CCD и отвечающего за ввод-вывод IOD. Каждый кристалл CCD по-прежнему включает восемь ядер, объединённых в CCX-кластер с общим кэшем третьего уровня объёмом 32 МБ. Однако производство этих чиплетов было переведено на более совершенные технологические процессы: для CCD применяется 5-нм норма, а для IOD — 6-нм. Это позволило AMD полностью сосредоточить выпуск на мощностях TSMC, отказавшись от сотрудничества с GlobalFoundries.

Использование более тонких техпроцессов способствовало существенному повышению рабочих частот. В топовых моделях Ryzen 7000 они достигли отметки 5,7 ГГц, установив новый рекорд для потребительских процессоров AMD. Однако рост частот сопровождался увеличением энергопотребления: максимальный теплопакет для настольных решений компании вырос до 170 Вт, что ранее не наблюдалось в серии Ryzen.

Существенные изменения затронули и микроархитектуру, хотя AMD сообщила лишь о 13% приросте IPC по сравнению с Zen 3. Это объяснимо, поскольку одним из главных новшеств стала поддержка набора инструкций AVX-512, не влияющего напрямую на IPC. Для выполнения 512-битных векторных операций в Zen 4 задействуется пара 256-битных FPU-блоков, что позволяет обрабатывать такие команды без значительного увеличения площади ядра и энергозатрат. Тем не менее, внутренние структуры ядра, включая регистровый файл и пути передачи данных, были расширены для корректной работы с 512-битными векторными операциями.

Кроме того, в микроархитектуре были доработаны и другие элементы. В Zen 4 значительно усовершенствовали блок предсказания переходов, что уменьшило количество ошибок предсказания и обеспечило более эффективную загрузку исполнительных модулей. Буфер декодированных команд увеличился на две трети и теперь способен передавать на выполнение до девяти инструкций за такт вместо прежних восьми. Также вдвое — с 512 КБ до 1 МБ на ядро — вырос объём кэша второго уровня, что сократило обращения к более медленному L3 и дополнительно улучшило эффективность обработки данных ядрами.

AMD не оставила без внимания и технологию 3D V-Cache в этом поколении. Процессоры с дополнительным 64-МБ кристаллом статической памяти, размещённым поверх чиплета CCD, вошли и в линейку Ryzen 7000. Причём на сей раз сфера применения решения расширилась. Помимо восьмиядерных моделей с 96 МБ кэша L3, в портфеле компании появились и 16-ядерные варианты, где увеличенный кэш применяется на одном из двух чиплетов. В итоге общий объём кэша третьего уровня у таких 16-ядерных процессоров достигает 128 МБ, распределённых между кристаллами по асимметричной схеме 96 + 32 МБ.

#Zen 5 — фундаментальное расширение ядра

В предыдущих поколениях процессоров AMD в основном фокусировалась на улучшениях высокоуровневых характеристик, не внося кардинальных изменений в глубинные основы микроархитектуры, однако с появлением Zen 5 ситуация изменилась. Этот этап развития ознаменовался масштабной переработкой функциональных блоков ядра, направленной на расширение возможностей архитектуры и повышение её способности обрабатывать больше инструкций параллельно. Особое внимание было уделено технологии SMT — инженеры AMD целенаправленно работали над тем, чтобы параллельно выполняемые на одном ядре потоки не конфликтовали за ресурсы и не мешали работе друг друга.

Что касается платформы и базовой структуры CPU, здесь практически ничего не изменилось. Процессоры Ryzen 9000, построенные на ядрах Zen 5, по-прежнему предназначены для экосистемы Socket AM5, используют уже знакомую чиплетную архитектуру с вычислительными кристаллами CCD и кристаллом ввода-вывода IOD, причём каждый CCD включает один восьмиядерный комплекс CCX. Более того, кристалл IOD в этом поколении перешёл без изменений от Zen 4, поэтому интерфейсные возможности Zen 5 сохранились прежними — включая поддержку памяти DDR5 и шины PCIe 5.0.

Однако лишь за счёт усовершенствований в глубине архитектуры AMD удалось достичь

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории