Компания Alibaba анонсировала серверный процессор XuanTie C950 с тактовой частотой 3,2 ГГц, построенный на открытой архитектуре RISC-V и произведённый по 5-нанометровой технологии, информирует издание SCMP. Как отмечает разработчик, чип создан для эффективной работы в облачных средах и под нагрузками искусственного интеллекта, способен справляться со сложными многошаговыми задачами, которые выполняют ИИ-агенты.
В компании заявляют, что это «самый производительный в мире процессор на архитектуре RISC-V». Мэн Цзяньи (Meng Jianyi), ведущий научный сотрудник исследовательского подразделения Alibaba — DAMO Academy, сообщил, что быстродействие модели C950 более чем втрое превышает показатели предыдущего поколения C920. «Открытая сущность RISC-V даёт проектировщикам микросхем возможность адаптировать наборы инструкций и ускорять решение специализированных задач ИИ с минимальными или нулевыми лицензионными отчислениями. Это имеет особое значение для создания ИИ-агентов», — передаёт слова представителей компании агентство Reuters.
Источник изображения: Alibaba
Специалисты DAMO Academy, отвечавшие за проектирование чипа, пояснили, что платформу XuanTie можно кастомизировать под определённые шаблоны логического вывода (инференса), что позволяет заказчикам оптимизировать микросхемы для своих потребностей. Alibaba также отметила, что в сравнении с рядом серийных продуктов её процессор демонстрирует свыше 30% прироста производительности «благодаря гибкости настройки под конкретные сценарии применения». Разработка C950 заняла два года, и это первый чип в семействе XuanTie, изначально спроектированный с расчётом на выполнение инференса больших языковых моделей (LLM) в качестве базовой нагрузки. Предыдущая серверная модель, C930, была представлена в феврале 2025 года, её поставки начались месяц спустя. Её предшественник, C920, поставляется с 2024 года.
Процессор XuanTie C950 представляет собой 64-битное решение с 8-инструкционным декодером и 16-стадийным конвейером, оснащённое предсказателем ветвлений TAGE и программируемым модулем предвыборки данных. Он соответствует стандарту RVA23 и расширен дополнительными командами. Заявленная производительность в тесте SPECint2006 достигает 22 балла на гигагерц. Чип поддерживает 256-битные векторные регистры и форматы данных FP16/BF16/FP32/FP64/INT8/INT16/INT32/INT64. Стандартный объём кэша инструкций — 64 КБ с опциональной проверкой чётности, кэш данных также обычно имеет 64 КБ с возможностью применения ECC. Каждое ядро обладает собственным кэшем второго уровня объёмом до 1 МБ, где коррекция ошибок является опцией. Типичная конфигурация кластера включает восемь ядер. Для внутренней коммуникации применяется шина CHI.E/CHI.F, а для внешнего взаимодействия — интерфейсы AMBA ACE4.0/AXI4.0.
Источник изображения: Alibaba
Благодаря глубокой интеграции программных и аппаратных компонентов, C950 демонстрирует высокую эффективность в облачных средах, включая работу с MySQL, Redis, Nginx и OpenSSL, а также выполнение логического вывода для крупных языковых моделей, таких как Qwen и DeepSeek. Процессор оптимизирован для совместного использования со специализированными ИИ-ускорителями компании — Alibaba Vector Acceleration Engine и Matrix Acceleration Engine, которые разрабатывались в тесной связи с CPU-ядром, а не добавлялись как отдельные модули.
Как заявляет производитель, C950 стал первым процессором на архитектуре RISC-V с аппаратной поддержкой логического вывода для языковых моделей с миллиардами параметров. Его расширенный набор инструкций и специализированные блоки предназначены для эффективного выполнения ключевых операций в моделях типа Qwen3 и DeepSeek V3, минимизируя дополнительные затраты ресурсов. Данный чип занимает ведущее положение в линейке процессоров Alibaba.
Источники: