Аналитика

OpenYard: Как не убить серверную платформу на старте — советы R&D-директора

Вячеслав Шипилов, OpenYard: Команда разработки должна учитывать весь жизненный цикл серверной платформы

В 2026 году OpenYard продолжает расширять ассортимент серверных платформ, охватывая различные процессорные архитектуры, типы нагрузок и условия эксплуатации. Одно из перспективных направлений связано с платформой на базе AMD, предназначенной для задач, где ключевыми являются производительность, масштабируемость, энергоэффективность и адаптивность конфигураций. О том, как отдел исследований и разработок (R&D) принимает решения о старте новых проектов, какие этапы проектирования и проверки наиболее важны, а также как опыт эксплуатации влияет на последующие поколения продуктов, рассказал Вячеслав Шипилов, возглавляющий департамент исследований и разработок OpenYard.

«Серверная платформа, которая одинаково эффективно закрывает все сценарии, практически невозможна»

CNews: Вячеслав, сегодня серверные платформы должны справляться с разнообразными нагрузками: от корпоративных систем и баз данных до высокопроизводительных вычислений и задач ИИ. Какие архитектурные требования это накладывает на создание новых решений?

Вячеслав Шипилов: Серверная платформа, способная одинаково эффективно обслуживать базы данных, корпоративные приложения, обучение больших языковых моделей (LLM) и высокопроизводительные вычисления, практически недостижима. Поэтому одним из главных архитектурных требований сегодня становится модульность и возможность настраивать платформу под конкретные задачи.

В линейке OpenYard представлены как OCP-совместимые решения, так и традиционные 19-дюймовые серверы. В сегменте OCP модульный подход особенно критичен: он позволяет заменять отдельные компоненты системы без необходимости полного перепроектирования. В классических 19-дюймовых серверах гибкость также остается основополагающим требованием, так как заказчикам требуются различные конфигурации для разных целей.

Еще один значимый аспект связан с управляемостью и мониторингом. Современный BMC уже не ограничивается только дистанционным запуском сервера. Он отслеживает потребление энергии, собирает данные телеметрии, поддерживает удаленное обновление микропрограмм и предоставляет эксплуатационным командам больше информации о состоянии системы. Поэтому развитие собственных BIOS и BMC для нас связано не только с наличием внутренней экспертизы, но и с возможностью интегрировать серверы в инфраструктуры с особыми требованиями к мониторингу и управлению.

Надежность закладывается не на финальных стадиях разработки, а с самых первых шагов: от моделирования целостности сигналов и питания до теплофизических расчетов. Затем следуют натурные испытания, в том числе при экстремальных температурах окружающей среды и пиковых нагрузках. Особое значение имеет качество серийного производства, и здесь ключевую роль играет наше предприятие в Рязани.

«В большинстве случаев заказчик приобретает не отдельный сервер, а решение, состоящее из десятков или сотен узлов»

CNews: Какие параметры сегодня становятся решающими при проектировании серверных платформ: производительность, плотность размещения, энергоэффективность, масштабируемость, совместимость с компонентами и ПО? Как R&D-команда находит баланс между этими требованиями?

Вячеслав Шипилов: Все перечисленные параметры имеют значение, но, если их упорядочить, я бы выделил три группы: масштабируемость, совместимость с компонентами и ПО, а также плотность размещения вместе с энергоэффективностью. Производительность в данном контексте — не самоцель, а результат правильного баланса архитектурных решений.

В большинстве случаев заказчик приобретает не отдельный сервер, а решение, состоящее из десятков или сотен узлов. Поэтому платформа должна масштабироваться без потери предсказуемости. Если при расширении инфраструктуры возникают проблемы с охлаждением, питанием, совместимостью или обслуживанием, высокая производительность отдельного сервера уже не решает задачу.

Плотность размещения и энергоэффективность особенно актуальны для современных дата-центров, где идет борьба за каждый ватт и каждый юнит пространства. В наших решениях большое внимание уделяется эффективному использованию внутреннего объема 1U, при этом обеспечивается стабильная работа системы без принудительного снижения производительности (троттлинга).

Совместимость с компонентами и ПО сегодня фактически становится обязанностью производителя серверной платформы. Заказчик не будет адаптировать свое программное обеспечение под новое оборудование. Поэтому OpenYard формирует внутренний список одобренных вендоров и перечень совместимых компонентов и ПО. Этот список создается на основе валидации, проведенной командой исследований и разработок, и продолжает обновляться после релиза платформы, поскольку рынок компонентов меняется, а для заказчиков важны сроки поставки, цена и качество конечного решения.

CNews: Как в R&D принимается решение о развитии новой платформы? Какие технологические, архитектурные и эксплуатационные факторы оцениваются на предварительном этапе?

Вячеслав Шипилов: Решение о запуске новой платформы принимает не только R&D. Обычно идея формируется на стыке продуктовой команды, исследований и разработок, производства и сервиса. Продуктовый отдел собирает требования, оценивает запросы рынка, конкурентную среду и экономику проекта. После этого начинается техническая проработка, где R&D оценивает реализуемость будущего решения.

Один из первых вопросов на этом этапе касается доступности документации по ключевым компонентам. Без нее даже сильная инженерная команда будет ограничена в разработке и сопровождении продукта. Не менее важна доступность самих компонентов: нет смысла проектировать платформу, если затем невозможно стабильно собрать спецификацию компонентов (BOM) в нужном объеме и с приемлемыми сроками поставки.

Отдельно оценивается доступность исходных кодов и инструментов, необходимых для разработки встроенного ПО. Для серверной платформы это критично, потому что базовая система ввода-вывода (BIOS) и контроллер управления материнской платы (BMC) напрямую влияют на управляемость, поддержку и дальнейшую модернизацию продукта.

Еще один важный фактор связан с собственной экспертизой. Нужно понимать, есть ли внутри компании инженеры, работавшие с подобной архитектурой, доступны ли специалисты для проекта, потребуется ли найм или привлечение внешней экспертизы. После этого формируется верхнеуровневая архитектура, проверяется реализуемость требований и оцениваются эксплуатационные аспекты: как платформа будет производиться, тестироваться, ремонтироваться и сопровождаться. Только после такого анализа проект может переходить в активную фазу разработки.

«Серверный рынок меняется, и производитель не может развивать линейку, ориентируясь только на привычные архитектуры»

CNews: В портфеле OpenYard появилась новая серверная платформа на базе AMD. Чем обусловлен выбор этой архитектуры и какую задачу новая платформа закрывает в линейке компании?

Вячеслав Шипилов: Компания OpenYard представила новую платформу RS202A на базе процессоров AMD EPYC 9005. Для компании это важный шаг, потому что исторически значительная часть нашей экспертизы и базы встроенного ПО формировалась вокруг архитектуры Intel. Кроме того, на российском рынке больше специалистов с практическим опытом работы именно с платформами Intel.

Но серверный рынок меняется, и производитель не может развивать линейку, ориентируясь только на привычные архитектуры. AMD заметно усилила позиции в корпоративных и высокопроизводительных системах, поэтому наличие такой платформы в портфеле становится для нас закономерным этапом развития.

Причины выбора AMD связаны с рядом факторов. С инженерной точки зрения, архитектура EPYC обеспечивает значительное количество линий PCIe, что критически для систем с развитой подсистемой ввода-вывода, сетевыми картами, накопителями и ускорителями. Вдобавок, платформа предлагает гармоничное соотношение количества ядер и тактовой частоты, а поддержка множества каналов памяти представляет интерес для задач с высокими требованиями к ресурсам.

Существует также финансовая составляющая. Для многих сценариев ключевым является стоимость в расчете на ядро, линию PCIe и общую архитектуру платформы. И наконец, для OpenYard важны доступность процессоров и разнообразие продуктовой линейки в условиях изменяющейся внешней среды.

CNews: На какие типы нагрузок рассчитана новая платформа на базе AMD? Можно ли выделить фокус на виртуализацию, облачные решения, высоконагруженные системы, аналитику или иные области?

Вячеслав Шипилов: Платформа отличается универсальностью, но ее преимущества наиболее ярко проявляются в задачах, где требуются параллельные вычисления, развитая система ввода-вывода и эффективное управление памятью. В первую очередь это облачные инфраструктуры, виртуализация, аналитика, транзакционные нагрузки и ресурсоемкие корпоративные сервисы.

Системы с большим числом физических ядер и высокой тактовой частотой делают платформу привлекательной для виртуализации и облачных сценариев. В таких случаях значение имеет не только объем ресурсов, но и то, сколько рабочих нагрузок можно надежно разместить на одном узле, а также поведение системы при высокой загрузке.

Объем кэш-памяти процессора может играть роль в транзакционных сценариях, где критичны задержки и скорость обработки запросов. Поддержка множества линий PCIe актуального поколения открывает возможности для аналитических задач, конфигураций с быстрыми накопителями, сетевыми адаптерами и дополнительными устройствами.

При этом я бы не ограничивал платформу одним классом применений. Ее роль в линейке OpenYard — предоставить заказчику возможность создать технически обоснованную конфигурацию с прозрачной экономикой, адаптированную под конкретный профиль нагрузки.

CNews: Какие технологические особенности новой платформы наиболее значимы с точки зрения производительности, масштабируемости, энергоэффективности и гибкости конфигураций?

Вячеслав Шипилов: Любое решение о запуске новой платформы должно исходить из понимания целевого заказчика и его потребностей. Универсальный сервер, одинаково эффективно справляющийся со всеми возможными сценариями, невозможен. Поэтому еще до начала основных работ необходимо сформировать техническое задание и определить, какие характеристики будут приоритетными.

Существуют параметры, на которые отдел исследований и разработок обращает внимание всегда. Один из них связан с производительностью, но не только в контексте числа ядер или частоты работы. Ключевое значение имеют пропускная способность и задержки на основных магистралях, совместимость с PCIe Gen5, работа с памятью DDR5, а также оптимизация топологии для снижения потерь и задержек внутри платформы.

Производительность должна быть сбалансирована с устойчивым тепловым режимом, надежным питанием, корректной работой памяти, возможностями ввода-вывода и удобством обслуживания. Если хотя бы один из этих аспектов нарушен, платформа может впечатлять в спецификациях, но вызывать трудности в реальной эксплуатации.

Еще один важный уровень связан с масштабируемостью и гибкостью конфигураций. Наша задача — обеспечить возможность роста платформы вместе с потребностями клиента без необходимости замены шасси или материнской платы. Этому способствует модульный подход и поддержка необходимой периферии. Отдельно стоит выделить энергоэффективность: для ЦОД важно не только получать высокую производительность, но и понимать, сколько полезной работы выполняется на единицу потребленной энергии.

CNews: Что означает поддержка различных процессорных архитектур в рамках серверной линейки с точки зрения разработки? Насколько сильно меняются подходы к проектированию, тестированию, валидации и последующему сопровождению таких платформ?

Вячеслав Шипилов: Внешне два сервера на разных процессорных архитектурах могут выглядеть почти идентично. Однако с инженерной точки зрения отличия начинаются уже на уровне схемотехники и топологии. Меняется не только процессорный сокет, но и система питания, интерфейсы, логика взаимодействия ключевых компонентов, требования к разводке и даже количество слоев в материнской плате.

Особенно заметны различия во встроенном ПО, в первую очередь в BIOS. Невозможно взять BIOS, созданный для одной архитектуры, и просто перекомпилировать его для другой. Для R&D это означает разные кодовые базы, разные наборы инструментов и необходимость в инженерах, специализирующихся на конкретной архитектуре.

Подходы к тестированию также меняются. Отличаются утилиты, методики, часть стендов для квалификационных испытаний, производственного тестирования и валидации. То, что корректно для одной платформы, нельзя автоматически переносить на другую без дополнительной проверки.

Сопровождение таких решений также требует отдельной экспертизы. Сервисной команде необходимо понимать архитектурные особенности платформы и специфику встроенного ПО, иначе сложные инциденты будет трудно анализировать. Кроме того, в текущих условиях приходится отдельно оценивать доступность документации и внешние ограничения для каждого производителя CPU.

CNews: Что стоит за выводом новой серверной платформы на рынок со стороны R&D: проектирование, тестирование, валидация, совместимость с компонентами, операционными системами и прикладным ПО?

Вячеслав Шипилов: В целом, у производителя есть два пути для включения новой серверной платформы в свой ассортимент. Первый — создание с чистого листа, когда команда самостоятельно определяет архитектуру, разрабатывает аппаратное обеспечение, механику, встроенное ПО и процедуры тестирования. Второй — адаптация готового решения под нужды конкретного рынка. Однако в обоих сценариях цель R&D едина: обеспечить надежность, воспроизводимость и готовность продукта к промышленному использованию.

Работа стартует задолго до официального запуска. Сначала определяются задачи, которые должна решать платформа, базовые конфигурации, а также требования к питанию, охлаждению, сервисному доступу, удаленному управлению и последующей поддержке. После этого начинается инженерная разработка: подбор компонентов, настройка BIOS, BMC, операционных систем, прикладного ПО и обеспечение их взаимной совместимости.

Отдельный крупный этап — тестирование и проверка. Мы оцениваем не только возможность запуска системы, но и ее стабильность при длительных нагрузках, температурные режимы, работу питания, реакцию на ошибки, обновление встроенного ПО, мониторинг и удаленное управление. Для клиента сервер должен представлять собой не просто набор совместимых деталей, а предсказуемую промышленную платформу.

Не менее важен переход от прототипа к серийному выпуску. Платформа должна быть воспроизводимой в производственных условиях, удобной для обслуживания, ремонтопригодной и готовой к длительной поддержке. Именно в этой незаметной части работы проявляется уровень зрелости R&D: качество сервера во многом зависит от того, насколько тщательно команда проработала архитектуру, валидацию, производство и сервисные сценарии еще до выхода продукта на рынок.

«Умение собирать обратную связь и трансформировать ее в инженерные решения указывает на зрелость производителя»

CNews: Как опыт эксплуатации уже установленных платформ возвращается в R&D? Какие данные, инциденты или наблюдения помогают улучшать архитектуру и учитывать реальные сценарии использования в следующих поколениях продуктов?

Вячеслав Шипилов: Способность собирать отзывы и преобразовывать их в технические улучшения говорит о зрелости производителя. В OpenYard такая информация поступает в R&D из нескольких каналов: от сервисной службы, производства и технических пресейлов.

Сервисный отдел фиксирует данные об инцидентах на уже развернутых платформах. Особое внимание уделяется повторяющимся отказам, сбоям и нестандартному поведению. Если проблема связана с архитектурой или встроенным ПО, она передается в R&D для анализа и последующей корректировки.

Производство предоставляет другой, не менее важный тип обратной связи. Эти сведения помогают улучшить конструкцию, схемотехнику и производственные тесты. Если потенциальную неисправность можно обнаружить на ранней стадии изготовления, это напрямую повышает качество конечного изделия.

Существует и другой канал получения обратной связи — тестирование опытных образцов непосредственно у клиентов. Крупные заказчики нередко располагают собственными методиками оценки платформ и имеют опыт взаимодействия с оборудованием от различных вендоров. Подобные отзывы представляют особую ценность, поскольку демонстрируют поведение продукта не в лабораторных условиях, а в среде, максимально приближенной к реальному использованию. Зачастую именно такие наблюдения становятся основой для корректировки текущих и разработки будущих решений.

CNews: Какие технологические приоритеты для R&D OpenYard станут ключевыми в ближайшее время: создание новых платформ, совершенствование архитектур, увеличение плотности и энергоэффективности, проверка компонентов, поддержка специализированных задач?

Вячеслав Шипилов: Задачи R&D на ближайшие год-два охватывают не только запуск новых платформ, но и улучшение качества на протяжении всего жизненного цикла продукта. Эта деятельность часто остается незаметной для конечного потребителя, однако без нее невозможно расширять продуктовую линейку и формировать репутацию надежного поставщика.

Основное внимание уделяется модернизации производственных испытательных стендов, внедрению автоматизированного тестирования, доработке тестовых сценариев, совершенствованию процессов верификации аппаратных компонентов и программного обеспечения, а также участию отдела R&D в создании методов входного контроля для новых типов компонентов. Качество для нас — это не просто сокращение числа дефектов, но и управление себестоимостью, стабильность поставок и доверие клиентов к бренду.

Одновременно с этим расширяется продуктовый портфель. Мы отмечаем повышение спроса на системы для обучения нейросетей, выполнения инференса и высокопроизводительных вычислений. В связи с этим OpenYard работает над увеличением ассортимента в сегменте платформ с плотным размещением GPU, JBOG-решений (систем с несколькими графическими ускорителями) и инновационных методов охлаждения. Кроме того, продолжается развитие стандартных 19-дюймовых решений и линейки OCP.

При этом наша задача — не выпустить на рынок максимальное количество новинок. Главными приоритетами остаются высокое качество и заполнение конкретных рыночных ниш. Если у клиента возникает четкий запрос, а в текущем портфеле отсутствует подходящий продукт, OpenYard готова инициировать разработку новых платформ вне зависимости от изначального плана. Такой подход обеспечивает развитие линейки не ради формальности, а исходя из реальных технологических потребностей рынка.

Рекламаerid:2W5zFJt1rwKРекламодатель: ООО «Центр открытых разработок»ИНН/ОГРН: 9705156518/1217700263340Сайт: https://openyard.ru/
Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости