Широко распространено мнение, что OpenAI и Nvidia — ключевые бенефициары бума в сфере искусственного интеллекта, и их тесное сотрудничество, как ожидается, будет скреплено сделкой на 100 миллиардов долларов. Однако, по данным инсайдеров, производительность чипов Nvidia для задач вывода (инференса) может не полностью соответствовать требованиям OpenAI, что побуждает компанию искать им достойную замену.
Источник изображения: Nvidia
Эту информацию удалось получить Reuters через свои источники, хотя публично OpenAI и Nvidia продолжают демонстрировать полную взаимную поддержку. Согласно этим данным, OpenAI намерена заменить до 10% своих вычислительных ускорителей на решения от других производителей, которые демонстрируют более высокую эффективность именно в инференсе — то есть при работе с уже обученными большими языковыми моделями.
OpenAI даже вела переговоры о поставках специализированных чипов со стартапами Cerebras и Groq, но Nvidia опередила её, приобретя в прошлом году Groq за 20 миллиардов долларов. Ранее Groq обсуждала с инвесторами привлечение до 14 миллиардов долларов, однако Nvidia предложила более выгодные условия при особой структуре сделки. Согласно ей, Groq сохранила права на лицензирование своих технологий, но ключевые инженеры по разработке ускорителей перешли в штат Nvidia. По сути, теперь Groq может предлагать другим компаниям в основном программное обеспечение для облачных систем. Параллельно возникают сомнения в целесообразности планируемой сделки, в рамках которой Nvidia может инвестировать в OpenAI до 100 миллиардов долларов. Обе стороны пока отрицают какие-либо разногласия, хотя Nvidia уточняет, что её обязательства не являются жёстко фиксированными.
С Cerebras OpenAI всё же удалось заключить соглашение: теперь компания будет закупать у неё так называемые «сверхмощные ускорители», хорошо зарекомендовавшие себя в задачах инференса. Основная проблема OpenAI до сих пор заключалась в сильной зависимости от решений Nvidia и AMD, которые используют внешнюю, пусть и сверхбыструю память HBM. Для задач вывода же более эффективны чипы с большим объёмом встроенной памяти. Именно такие решения предлагают Groq и Cerebras, а также конкурент Google. С последней, к слову, смогла договориться компания Anthropic, что и вынудило OpenAI искать другие варианты.
Согласно отдельным сообщениям, в OpenAI столкнулись с недостаточной эффективностью ускорителей Nvidia в процессе разработки ИИ-агента Codex, предназначенного для помощи программистам в написании кода. Хотя рядовые пользователи того же ChatGPT с подобными сложностями не сталкиваются, для разработчиков OpenAI планирует внедрить альтернативные аппаратные платформы, такие как решения от Cerebras, чтобы улучшить быстродействие специализированного программного обеспечения.