Крупнейшие технологические корпорации Китая, такие как Alibaba и ByteDance, обучают свои новейшие языковые модели в дата-центрах, расположенных в странах Юго-Восточной Азии. Как сообщает The Financial Times со ссылкой на осведомлённые источники, такая практика обусловлена отсутствием доступа к передовым ускорителям NVIDIA на территории КНР из-за американских экспортных барьеров.
По информации источников, после апрельских ограничений администрации США на поставки специализированных чипов NVIDIA H20 для китайского рынка наблюдается стабильный рост объёмов обучения ИИ-моделей за границей. Представитель сингапурского оператора ЦОД пояснил логику такого подхода: «Создание передовых алгоритмов требует мощнейших процессоров, и текущие действия полностью соответствуют правовым нормам». Активному развитию дата-центров в Сингапуре и Малайзии способствует растущий спрос со стороны китайских клиентов, причём многие из этих объектов укомплектованы высокопроизводительными чипами NVIDIA.
Как отмечают осведомлённые лица, применяется прозрачная схема: китайские фирмы арендуют мощности в зарубежных дата-центрах, управляемых компаниями из других стран. Это не нарушает американских экспортных правил, поскольку «Правило распространения ИИ» — норматив, принятый при администрации Байдена для регулирования экспорта ИИ-технологий и устранения подобных лазеек, — был отменён Дональдом Трампом в мае. Китайские компании неоднократно фиксировались при использовании зарубежных мощностей как в текущем, так и в прошлом году.
Источник изображения: Mark Daynes / Unsplash
Однако существуют и отдельные случаи. По информации инсайдеров, DeepSeek, к примеру, проводит обучение своих нейросетей непосредственно внутри страны. Как отмечают осведомлённые лица, компании удалось сформировать запас чипов NVIDIA до того, как американские экспортные ограничения вступили в силу. Кроме того, DeepSeek активно взаимодействует с отечественными производителями полупроводников, в том числе с отраслевым гигантом Huawei, для совершенствования и создания нового поколения ускорителей искусственного интеллекта. Со своей стороны, Huawei расценивает сотрудничество с DeepSeek как стратегический шанс для укрепления позиций своей продукции в Китае.
В течение минувшего года ИИ-модели Qwen от Alibaba и Doubao от ByteDance завоевали международное признание в числе наиболее производительных больших языковых моделей. Qwen также стала популярной среди разработчиков за рубежом благодаря своей открытой архитектуре. При этом многие китайские корпорации по-прежнему выбирают для обучения моделей передовые ускорители NVIDIA, однако для инференса — процесса, приобретающего растущую значимость, — они всё активнее применяют чипы местного производства.
Китайские технологические гиганты также размещают дата-центры в Юго-Восточной Азии для обслуживания иностранных заказчиков, поскольку такие компании, как Alibaba и ByteDance, наращивают присутствие на глобальном рынке облачных сервисов. Одновременно китайские предприятия расширяют использование ЦОД в других регионах, включая Ближний Восток. В то же время, как поясняют отраслевые эксперты, из-за действующего в Китае запрета на трансграничную передачу персональных данных, адаптацию моделей под локальных пользователей необходимо осуществлять внутри страны.
Источник: