Корпорация Microsoft открыла в Атланте (штат Джорджия) второй центр обработки данных для искусственного интеллекта в рамках проекта Fairwater, объединив его с аналогичным объектом в Висконсине для формирования масштабного вычислительного кластера. Взаимодействие между ЦОД обеспечивается через специализированную оптоволоконную сеть AI Wide Area Network (AI WAN), созданную специально для решения задач искусственного интеллекта. Точные параметры и производительность нового дата-центра пока не разглашаются, однако эти объекты станут самыми крупными в истории Microsoft и, вероятно, во всём мире.
В дата-центре применяется замкнутая система жидкостного охлаждения, обслуживаемая одной из наиболее мощных чиллерных установок в мире. Каждый ряд стоек поддерживает мощность около 140 кВт (суммарно 1360 кВт на ряд). Комплекс оснащён сотнями тысяч современных ускорителей NVIDIA GB200/GB300 NVL72 для задач ИИ, связанных двухуровневой сетью 800GbE с коммутаторами на платформе SONiC. Атлантский ЦОД имеет двухэтажную конструкцию, что позволяет минимизировать расстояние между стойками по всем трём пространственным направлениям.
Источник изображения: Microsoft
Для сети AI WAN компания совместно с OpenAI, NVIDIA и другими партнёрами разработала и внедрила протокол Multi-Path Reliable Connected (MRC), обеспечивающий оптимальное взаимодействие между распределёнными дата-центрами Fairwater при обучении гигантских моделей, которые невозможно разместить в пределах одного ЦОД. Суммарная протяжённость линий AI WAN превышает 193 тысячи километров.
Источник изображения: Microsoft
В Microsoft подчеркнули, что стабильная энергосистема Атланты позволила обойтись без строительства локальных электростанций, применения специализированных источников бесперебойного питания и дублирующих энерголиний, что ускорило ввод ЦОД в эксплуатацию и снизило операционные расходы. Как сообщила компания, им удалось обеспечить уровень доступности 99,99 % при затратах, характерных для 99,9 %.
Источник изображения: Microsoft
Также были созданы эксклюзивные программно-аппаратные механизмы контроля энергопотребления, которые компенсируют пиковые нагрузки в сети от работы систем искусственного интеллекта. Это достигается путём запуска фоновых процессов в периоды низкой активности, автоматического регулирования мощности графических процессоров и применения локальных систем накопления энергии.
Источник изображения: Microsoft
Microsoft продолжает расширять пул дата-центров в рамках проекта Fairwater, планируя объединить их в единую экосистему, где центры обработки данных станут элементами распределённого виртуального суперкомпьютера. Такой подход открывает возможности, недостижимые для изолированных объектов. По мнению представителей компании, если классический ЦОД обслуживает множество приложений для разных заказчиков, то «ИИ-суперфабрика» концентрируется на решении единой сложной задачи, задействуя миллионы вычислительных модулей.
Корпорация Microsoft сталкивается с быстрым ростом капитальных вложений в инфраструктуру ЦОД и вычислительные ускорители. Руководство компании отмечает, что «фактически ни одна местность не стремится разместить дата-центр в непосредственной близости». Во многих районах жители выражают обеспокоенность потенциальным ростом тарифов на услуги ЖКХ, негативным влиянием на окружающую среду и другими факторами.
Источник: