Корпорация Meta✴, как информирует The Register в своей публикации, анонсировала углубление взаимодействия с облачной платформой AWS. Решение касается задействования Arm-процессоров Graviton5 для обеспечения определённых задач в сфере ИИ, прежде всего агентных систем. Сама AWS отмечает колоссальный интерес к своим фирменным чипам. В числе значимых клиентов фигурирует, к примеру, Uber.
Чипы Graviton5 были представлены AWS в конце минувшего года. Данные решения оснащены 192 ядрами Neoverse V3 (Poseidon), причём каждое ядро располагает 2 Мбайт кеша второго уровня. Совокупный объём кеша L3 достигает 192 Мбайт. Предусмотрено 12 каналов оперативной памяти DDR5-8800. Заявляется, что прирост производительности составляет до 25 % по сравнению с процессорами Graviton предшествующего поколения.
Meta✴ планирует задействовать для собственных нужд «десятки миллионов» ядер Graviton5. Таким образом, компания войдёт в число крупнейших потребителей, использующих чипы, разработанные AWS. Руководитель инфраструктурного подразделения Meta✴ отметил, что партнёрство с AWS нацелено на диверсификацию вычислительных мощностей. По его мнению, это требуется в контексте осуществления масштабных инициатив в области искусственного интеллекта.
Источник изображения: AWS
Ранее Meta✴ заявила о стратегическом альянсе с компанией Arm Holdings, нацеленном на «повышение эффективности ИИ на всех уровнях вычислений, включая программное обеспечение и дата-центровую инфраструктуру». В частности, Meta✴ собирается применять чипы Arm AGI, специально адаптированные для агентного ИИ. Однако, как уточняет The Register, данные изделия поступят в центры обработки данных Meta✴ не раньше конца текущего года, поэтому корпорация пока будет развёртывать соответствующие нагрузки на базе Graviton5 в облаке AWS.
Специалисты Counterpoint Research предполагают, что к 2029 году доля Arm-решений на рынке серверных ASIC-изделий для искусственного интеллекта может достигнуть 90 %. В то же время сама компания Meta✴ разрабатывает собственные ИИ-ускорители MTIA, которые в разных версиях могут использоваться для обучения моделей, выполнения инференса и других задач.
Источник: