Компания Google сообщила, что перевела примерно 30 тысяч внутренних рабочих нагрузок на архитектуру Arm и намерена адаптировать ещё около 70 тысяч. В этом ей помогает искусственный интеллект, хотя пока не с максимальной эффективностью. При этом организация пока не собирается полностью отказываться от x86-процессоров в пользу собственных Arm-чипов Axion. Такие сервисы, как YouTube, Gmail и BigQuery, уже функционируют как на x86, так и на Arm-платформах. В ходе переноса приходится учитывать архитектурные нюансы, включая обработку чисел с плавающей запятой, параллельные вычисления, специфичные для платформы технологии и вопросы производительности.
Сотрудники Google пояснили, что изначально они мигрировали ряд ключевых систем, включая F1, Spanner и Bigtable, применяя традиционные подходы разработки с участием инженеров. Выяснилось, что современные компиляторы и инструменты, такие как санитайзеры и фаззеры, помогли избежать многих неожиданных сложностей. Основное время было потрачено на корректировку тестов, модернизацию сложных систем сборки и развёртывания — особенно для наиболее старых и ресурсоёмких сервисов, решение проблем масштабного внедрения в производственных средах и меры по предотвращению сбоев в критически важных системах.
Источник изображения: Google
30 тысяч приложений представляют собой значительный объём кода, что побудило компанию задуматься об автоматизации процессов. Для этого был разработан мультиагентный ИИ-инструмент CogniPort, предназначенный для исправления ошибок сборки и тестирования. Он успешно решал задачи примерно в 30% случаев, демонстрируя наилучшие результаты в области корректировки тестов, платформенно-зависимых аспектов и особенностей представления данных. Хотя эффективность пока невысока, Google предстоит адаптировать ещё десятки тысяч рабочих нагрузок и пакетов.
Источник изображения: Google
Параллельно компания запустила инновационную платформу CHAMP для постоянного отслеживания состояния и развёртывания многопроцессорных рабочих нагрузок, автоматически отсеивающую задания с проблемами на архитектуре Arm — такими как периодические сбои или неудовлетворительная скорость работы — для дальнейшего анализа и оптимизации. Чем больше задач будет обработано, тем эффективнее Borg, система управления кластерами Google, сможет распределять нагрузки для максимальной загрузки Arm-серверов.
Это приведёт к сокращению расходов, поскольку, по данным Google, платформа Axion демонстрирует на 65% более выгодное сочетание стоимости и производительности в сравнении с x86-решениями, а также на 60% превосходит их по энергоэффективности. Ранее в Google, по слухам, выражали неудовлетворённость совокупной стоимостью владения новейшими процессорами Intel Xeon. Вероятно, именно это подтолкнуло корпорацию к разработке собственных чипов.
Источник изображения: Google
Первой в этом направлении, также ради снижения совокупных затрат, начала двигаться Amazon, разработавшая уже четыре поколения Arm-процессоров Graviton. В минувшем году компания сообщила о выпуске более 2 млн таких чипов. Alibaba Cloud в 2021 году анонсировала собственный Arm-процессор Yitian 710. У Microsoft с прошлого года функционируют чипы Cobalt 100, на которые также переведена часть внутренних операций.
Завершает картину Oracle, объявившая два года назад о полном переходе своих облачных сервисов, включая ключевую систему управления базами данных, на архитектуру Arm. Компания использует процессоры Ampere Computing, чьей значительной долей она владела до сделки с SoftBank. Благодаря этим решениям Arm захватила четверть рынка серверных процессоров, однако переломным моментом стало внедрение NVIDIA GB200/GB300. Arm также подписала стратегическое партнёрство с Meta✴ для содействия в оптимизации программного обеспечения.
Источник: