ОС и софт

Новый чип Bertha 500 в 5 раз эффективнее флагманского H100 в задачах ИИ

Как сообщает издание EETimes, южнокорейская компания HyperAccel намерена выпустить специализированный процессор Bertha 500 для задач вывода ИИ-моделей. По словам разработчика, уникальная архитектура чипа позволяет ему обрабатывать в пять раз больше токенов в секунду, чем GPU-решения с аналогичными показателями TOPS.

Ключевой особенностью Bertha 500 является его экономичность. Для снижения стоимости вместо дорогой памяти HBM здесь применяется LPDDR. Отказ от стандартной иерархии памяти позволяет задействовать до 90% её пропускной способности. Архитектура чипа специально оптимизирована для инференса, что дополнительно повышает эффективность. Для сравнения, по данным HyperAccel, графические процессоры при выполнении аналогичных задач используют лишь около 45% пропускной способности памяти и 30% вычислительных мощностей. Таким образом, чип Bertha 500, несколько уступая в абсолютной производительности, обеспечивает существенное сокращение затрат.

Процессор Bertha 500 будет изготавливаться по 4-нм технологии Samsung. Он включает 32 вычислительных ядра LPU (LLM Processing Unit), четыре ядра Arm Cortex-A53 и 256 МБ статической памяти SRAM. Подсистема памяти LPDDR5x использует восемь каналов и обеспечивает пропускную способность до 560 ГБ/с. Заявленная производительность в операциях INT8 достигает 768 TOPS. Чип также поддерживает другие форматы данных, включая 16-, 8-, 4-битные и FP16. По утверждению HyperAccel, соотношение пропускной способности к стоимости у Bertha 500 примерно в 20 раз выше, чем у NVIDIA H100, а энергоэффективность — в пять раз лучше. Потребляемая мощность чипа составит около 250 Вт.

 Источник изображения: EETimes

Источник изображения: EETimes

Программное обеспечение HyperAccel совместимо со всеми моделями из репозитория HuggingFace. Параллельно компания разрабатывает предметно-ориентированный язык Legato, который даст разработчикам прямой низкоуровневый доступ к системе. Ожидается, что первые образцы Bertha 500 появятся к концу первого квартала 2026 года, а серийный выпуск начнётся в начале 2027 года.

Кроме того, сообщается, что в партнёрстве с LG стартап создаёт облегчённую модификацию Bertha 500 для периферийных устройств — Bertha 100. Данная система-на-кристалле будет оснащена ядрами Arm Cortex-A55 и собственными компонентами LG, а также поддержкой двухканальной памяти LPDDR5x. В числе потенциальных областей использования указаны автопром, потребительская электроника и робототехника. Выпуск Bertha 100 планируется в форм-факторе модулей M.2: первые образцы появятся в четвёртом квартале этого года. Платформа сможет, к примеру, выполнять преобразование текста в голос или распознавание речи.

Стартап HyperAccel был учреждён профессором Корейского института передовых технологий (KAIST) Джуёном Кимом совместно с группой его студентов в начале 2023 года. На текущий момент компания привлекла инвестиции в размере 45 миллионов долларов, а её рыночная капитализация оценивается в 200 миллионов долларов. Численность сотрудников составляет около 80 человек. Первым продуктом HyperAccel стал специализированный FPGA-сервер Orion, созданный для выполнения задач искусственного интеллекта.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости