Компании OpenAI и Broadcom анонсировали специализированный чип Jalapeño, созданный в рамках плотного партнёрства, «следуя представлениям OpenAI о том, как должен выглядеть будущий инференс LLM». По результатам начальных испытаний, ускоритель первого поколения показывает заметно более высокую производительность на каждый ватт по сравнению с нынешними решениями на рынке.
Как заявляет OpenAI, Jalapeño проектировался с чистого листа под актуальные и перспективные большие языковые модели. Применение собственных ИИ-моделей OpenAI на всех этапах — от концепции до запуска в производство — позволило уложиться всего в девять месяцев. В компании отметили, что разработка Jalapeño велась «с опорой на дорожную карту развития моделей, ядер, систем обслуживания и продуктовых потребностей, совместно с партнёрами Broadcom и Celestica». Чип задуман не как обособленный ускоритель, а как элемент масштабируемого программно-аппаратного комплекса.
Инженерные образцы Jalapeño уже функционируют в лаборатории, выполняя задачи машинного обучения на заданной частоте и при установленном энергопотреблении, в том числе с GPT‑5.3‑Codex‑Spark. Компания обещает опубликовать детальный технический отчёт о характеристиках ускорителя в ближайшие месяцы. Как передаёт Bloomberg, со слов гендиректора Broadcom Хока Тана, на текущий момент ускоритель позволяет сократить расходы примерно на 50 % по сравнению с типовыми ИИ-ускорителями.
Отмечается, что архитектура чипа минимизирует перемещение данных и добивается баланса между вычислительными мощностями, сетевыми ресурсами и объёмом памяти, что позволяет приблизить фактическую загрузку к теоретическому пику производительности. Внедрение аппаратных и сетевых решений Broadcom, в частности Tomahawk, способствует выходу платформы на уровень крупномасштабного производства.
OpenAI заявила, что нацелена на создание полного стека для своего продукта. Компания не просто разрабатывает передовые модели и решения на их основе, но и проектирует инфраструктуру, которая их поддерживает: архитектуру чипов, ядра, системы памяти, сети, управление, системы развёртывания и пользовательский опыт. Это позволяет оптимизировать каждый уровень стека для достижения главной цели компании — сделать свои модели быстрее, надёжнее и более доступными для пользователей.
Стремясь сократить расходы на ИИ-инфраструктуру, Amazon (Trainium), Google (TPU), Meta✴ (MTIA) и Microsoft (Maia) также разрабатывают собственные кастомные ИИ-ускорители. Во многом это связано и с желанием уменьшить зависимость от чипов NVIDIA.
Источник: