Новости

Дефицит памяти вынудил M**a продлить жизнь серверам: что это значит для IT-инфраструктуры

Компания Meta была вынуждена увеличить срок службы некоторых своих универсальных серверов с шести до семи лет из-за нехватки DRAM. Как сообщает The Wall Street Journal со ссылкой на внутренние документы технологического гиганта, компания не прогнозировала столь серьёзного дефицита поставок компонентов, вызванного в первую очередь нехваткой оперативной памяти и жёстких дисков. Ожидается, что эта нехватка сохранится как минимум до 2027 года.

Ежегодно компания вкладывает колоссальные средства в инфраструктуру дата-центров и является одним из крупнейших мировых покупателей серверного оборудования. Однако даже увеличение капитальных затрат до $125–$145 млрд в текущем году не позволяет обновлять серверы с прежней скоростью. Внутреннее моделирование Meta показало, что продление срока эксплуатации серверов приведёт к росту ожидаемой годовой частоты отказов (AFR) с 4,8 % до 7,4 % в год. Такой уровень риска признаётся допустимым, хотя от увеличения срока службы до восьми лет решили отказаться.

95 % мирового объёма DRAM производят компании Samsung Electronics, SK hynix и Micron Technology. В последние полтора года они сосредоточились на наращивании выпуска HBM для ИИ-ускорителей, так как такая память приносит значительно большую маржу, чем обычная серверная DRAM. По оценкам IDC, речь может идти уже не о временном «циклическом» дефиците, а о стратегическом перераспределении производственных мощностей. Согласно прогнозам, к 2026 году на HBM будет приходиться около 25 % всех выпускаемых пластин DRAM, при этом спрос на неё растёт примерно на 70 % ежегодно.

 Источник изображений: ***

Источник изображений: Meta

Стоимость DDR5 и прочих модулей памяти значительно подскочила. Однако и с остальными комплектующими ситуация не лучше. Western Digital уже полностью распродала даже те HDD, которые ещё не были выпущены, у Seagate дела также идут превосходно (с точки зрения самой компании), а сроки поставок отдельных моделей серверных процессоров увеличились до полугода. Таким образом, один из крупнейших мировых заказчиков серверного оснащения, в отличие от многих аналитиков, не рассчитывает на удешевление памяти и других деталей к концу 2026 года, а вместо этого делает ставку на продление срока службы уже установленного оборудования.

Для менее крупных покупателей это может стать сигналом о нарастающих сложностях с закупками в ближайшем будущем. Если гиперскейлер не надеется получить достаточный объём памяти по адекватной цене, то остальные могут столкнуться с ещё более долгими сроками доставки, неполным выполнением заказов и существенным ростом стоимости. Вполне вероятно, что увеличение времени эксплуатации оборудования — наилучший вариант не только для Meta, что, помимо прочего, повлечёт за собой перенос капитальных затрат и замедление внедрения более энергоэффективных и производительных платформ.

Более того, дефициту HDD и SSD уделяется гораздо меньше внимания, чем нехватке DRAM, что, по всей видимости, является ошибкой при планировании закупок. Массовый выкуп HDD и рост цен на NAND оставляют всё меньше возможностей для манёвра при создании инфраструктуры хранения данных. По оценкам специалистов, новые производственные линии для модулей памяти заработают ещё нескоро, и дефицит может постепенно ослабнуть в 2027–2028 годах, когда начнут приносить результаты инвестиции 2024–2025 годов.

В качестве временного решения возможно повышение эффективности использования имеющегося оборудования с помощью программных инструментов. К примеру, NVIDIA представила новое ПО для отслеживания и продления срока службы ИИ-ускорителей в ЦОД. С другой стороны, индустрия уже не впервые прибегает к увеличению срока эксплуатации устройств. Так поступали Microsoft, Google, CloudFlare, Scaleway и другие.

Ссылки:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости