Согласно информации от нескольких инсайдеров в отрасли, OpenAI выражает неудовлетворённость некоторыми чипами для искусственного интеллекта от NVIDIA и уже около года изучает возможные замены. Это может создать напряжённость в отношениях между ключевыми участниками рынка на фоне стремительного роста сферы ИИ, пишет Reuters. Сдвиг в стратегии OpenAI объясняется повышенным вниманием к задачам инференса. NVIDIA традиционно лидирует в сегменте ускорителей для обучения нейросетей, однако сейчас инференс превратился в самостоятельный и высококонкурентный рынок.
Действия OpenAI бросают вызов монополии NVIDIA в области ИИ и осложняют сделку на 100 миллиардов долларов, в рамках которой производитель чипов должен был получить долю в ИИ-стартапе в обмен на приоритетный доступ к новейшим ускорителям. Изначально планировалось завершить соглашение за несколько недель, однако переговоры затянулись на месяцы. Параллельно OpenAI подписала партнёрские соглашения с AMD и Cerebras (которую в прошлом даже рассматривали для приобретения) для поставок «альтернативных» процессоров, а также совместно с Broadcom ведёт разработку собственного ИИ-ускорителя. Amazon и Google также выразили готовность предоставить OpenAI свои чипы. Корректировка планов OpenAI повлекла за собой изменение потребностей в вычислительных ресурсах и замедлила диалог с NVIDIA.
Источник изображения: Robin Jonathan Deutsch / Unsplash
В прошлую субботу генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) опроверг слухи о разногласиях с OpenAI, назвав их «вздором» и отметив, что клиенты по-прежнему выбирают NVIDIA для инференса, поскольку компания предлагает оптимальное сочетание производительности и совокупной стоимости владения, особенно в крупных масштабах. Со своей стороны, представитель OpenAI заявил, что компания зависит от поставок большинства чипов для инференса от NVIDIA, чьи решения обеспечивают максимальную производительность на каждый потраченный доллар. Генеральный директор OpenAI Сэм Альтман (Sam Altman) добавил, что NVIDIA создаёт «лучшие в мире чипы», и выразил надежду, что OpenAI останется её «крупнейшим» клиентом на долгие годы вперёд.
По информации Reuters, ссылающейся на семь информированных лиц, OpenAI не вполне довольна скоростью вывода, обеспечиваемой чипами NVIDIA. Особенно это касается узких задач, таких как генерация программного кода с помощью ИИ или его взаимодействие с другим софтом. Как отметил один из собеседников, компании потребуется новое аппаратное решение, которое в перспективе сможет покрыть примерно 10% вычислительных потребностей для инференса.
Источник изображения: OpenAI
OpenAI изучала возможности сотрудничества с ИИ-стартапами, такими как Cerebras и Groq, для получения более производительных решений для инференса, однако NVIDIA фактически поглотила Groq за $20 млрд, что положило конец переговорам. Хотя формально речь шла о неэксклюзивном лицензировании технологий Groq, что теоретически оставляет доступ для других компаний, на практике почти все ключевые разработчики перешли в NVIDIA, а оставшаяся небольшая группа занимается лишь обслуживанием текущих облачных контрактов.
Чипы NVIDIA отлично справляются с обработкой огромных массивов данных при обучении крупных ИИ-моделей, подобных тем, что лежат в основе ChatGPT. Однако дальнейшее развитие требует массового применения уже обученных моделей для задач вывода и логических рассуждений. Сообщается, что с 2025 года OpenAI ищет альтернативы ускорителям NVIDIA, уделяя особое внимание компаниям, разрабатывающим чипы с большим объёмом встроенной SRAM-памяти. Решение Maia 200 от Microsoft, судя по всему, не вполне соответствует её запросам.
Источник изображения: Hermann Wittekopf - kmkb / Unsplash
Процесс инференса моделей предъявляет более высокие требования к памяти по сравнению с этапом обучения, в то время как вычислительная нагрузка, напротив, снижается. В результате зачастую больше времени тратится на доступ к данным, чем на сами вычисления. NVIDIA и AMD используют внешнюю память, что замедляет, например, процессы общения с чат-ботами. В OpenAI столкнулись с подобными проблемами при использовании системы Codex, активно продвигаемой для автоматического написания кода. В компании полагают, что некоторые недостатки системы связаны именно с архитектурой оборудования NVIDIA.
Другие игроки рынка, конкурирующие с OpenAI, выбирают иные аппаратные решения. Компания Anthropic широко применяет чипы AWS Trainium и Google TPU, в то время как Google уже давно использует собственные тензорные процессоры (TPU) и теперь предлагает их другим. Эти процессоры оптимизированы, в частности, для выполнения выводов моделей и в определённых задачах демонстрируют более высокую производительность по сравнению с универсальными GPU от AMD и NVIDIA.
После того как OpenAI чётко обозначила свою позицию относительно технологий NVIDIA, последняя предложила выкупить бизнес у разработчиков ускорителей, ориентированных на SRAM, включая Cerebras и Groq. Cerebras отклонила это предложение и заключила прямое соглашение с OpenAI. Groq, в свою очередь, вела переговоры с OpenAI о предоставлении вычислительных ресурсов, что привлекло внимание инвесторов и привело к оценке капитализации компании в $14 млрд.
Источник информации: