ОС и софт

OpenAI и Broadcom представили чип Jalapeño: новый ускоритель для ИИ, который обходит аналоги по энергоэффективности

Компании OpenAI и Broadcom анонсировали специализированный чип Jalapeño, созданный в рамках плотного партнёрства, «следуя представлениям OpenAI о том, как должен выглядеть будущий инференс LLM». По результатам начальных испытаний, ускоритель первого поколения показывает заметно более высокую производительность на каждый ватт по сравнению с нынешними решениями на рынке.

Как заявляет OpenAI, Jalapeño проектировался с чистого листа под актуальные и перспективные большие языковые модели. Применение собственных ИИ-моделей OpenAI на всех этапах — от концепции до запуска в производство — позволило уложиться всего в девять месяцев. В компании отметили, что разработка Jalapeño велась «с опорой на дорожную карту развития моделей, ядер, систем обслуживания и продуктовых потребностей, совместно с партнёрами Broadcom и Celestica». Чип задуман не как обособленный ускоритель, а как элемент масштабируемого программно-аппаратного комплекса.

Инженерные образцы Jalapeño уже функционируют в лаборатории, выполняя задачи машинного обучения на заданной частоте и при установленном энергопотреблении, в том числе с GPT‑5.3‑Codex‑Spark. Компания обещает опубликовать детальный технический отчёт о характеристиках ускорителя в ближайшие месяцы. Как передаёт Bloomberg, со слов гендиректора Broadcom Хока Тана, на текущий момент ускоритель позволяет сократить расходы примерно на 50 % по сравнению с типовыми ИИ-ускорителями.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Отмечается, что архитектура чипа минимизирует перемещение данных и добивается баланса между вычислительными мощностями, сетевыми ресурсами и объёмом памяти, что позволяет приблизить фактическую загрузку к теоретическому пику производительности. Внедрение аппаратных и сетевых решений Broadcom, в частности Tomahawk, способствует выходу платформы на уровень крупномасштабного производства.

OpenAI заявила, что нацелена на создание полного стека для своего продукта. Компания не просто разрабатывает передовые модели и решения на их основе, но и проектирует инфраструктуру, которая их поддерживает: архитектуру чипов, ядра, системы памяти, сети, управление, системы развёртывания и пользовательский опыт. Это позволяет оптимизировать каждый уровень стека для достижения главной цели компании — сделать свои модели быстрее, надёжнее и более доступными для пользователей.

Стремясь сократить расходы на ИИ-инфраструктуру, Amazon (Trainium), Google (TPU), Meta (MTIA) и Microsoft (Maia) также разрабатывают собственные кастомные ИИ-ускорители. Во многом это связано и с желанием уменьшить зависимость от чипов NVIDIA.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости