Новости Software

Китай обогнал США: кто теперь лидирует в генерации видео с помощью ИИ

Специалисты, опрошенные изданием Financial Times, едины во мнении, что, хотя американские создатели систем ИИ лидируют в разработке ассистентов для программирования, в области генерации видео по текстовым описаниям пальма первенства уже перешла к китайским разработчикам. Их инструменты превосходят аналоги по качеству и удобству эксплуатации.

 Источник изображения: ByteDance

Источник изображения: ByteDance

Для тренировки столь крупных языковых моделей требуется огромный объём видеоматериалов, и здесь китайские платформы, обладающие широкой пользовательской базой, получают явное преимущество. Некоторые эксперты также полагают, что китайские разработчики зачастую игнорируют нормы авторского права при обучении специализированных моделей. С другой стороны, подобные ограничения приводят к тому, что американские модели создают менее реалистичные видеоролики.

Основатель стартапа Director AI Бен Цзян (Ben Chiang), занимающийся производством короткометражных мультфильмов и сериалов с помощью ИИ-генераторов, отмечает прогресс китайских видеогенераторов в качестве работы. В частности, они точнее интерпретируют текстовые запросы, синхронизируют аудиодорожку и стабилизируют голоса персонажей. Независимый продюсер Георгий Размадзе (George Won) из Тбилиси подчёркивает, что китайские генераторы видео позволяют плавно изменять угол съёмки без потери деталей освещения и чёткости лиц героев, тогда как многие другие модели в таких случаях страдают от артефактов.

Независимая платформа Arena даёт высокие оценки ИИ-моделям Kling, Seedance 2.0 и HappyHorse 1.0. Американская Veo 3 от корпорации Google также приближается к ним благодаря доступу к родственному сервису YouTube, однако из-за ограничений в области авторских прав она не столь совершенна, как могла бы быть. Успех китайских ИИ-генераторов видео даже подтолкнул компанию Kuaishou к мысли выделить Kling в отдельный бизнес и вывести его на биржу. Либеральный подход к использованию контента, защищённого авторским правом, уже вызвал претензии к ByteDance со стороны создателей персонажей вселенной Marvel и мультсериала South Park. Китайской компании пришлось взять на себя обязательства по усилению защиты в этой области.

В то же время китайские генераторы видео оказываются более удобными в использовании, так как они не сталкиваются с многочисленными ограничениями на этапе формирования текстового запроса и реже выдают ошибки. Однако высокий спрос на услуги, например, Seedance 2.0 в феврале этого года, привёл к тому, что доступ к этой ИИ-модели пришлось ограничить, а время ожидания для некоторых пользователей увеличить. Американским клиентам ByteDance приходится получать доступ к Seedance на особых условиях. В корпоративном сегменте им иногда нужно заранее внести до $2 млн. Тем не менее, на рынке уже существуют инструменты, позволяющие обходить такие препятствия. Поддержание инфраструктуры для генерации видео требует значительных затрат, поскольку они потребляют больше ресурсов по сравнению с моделями, работающими исключительно со звуком или текстом. На этом фоне OpenAI в марте даже отказалась от развития своей модели Sora. При создании рекламных роликов ИИ уже активно используется в больших масштабах, и представители отрасли считают его крайне удобным и выгодным инструментом — тем более что качество контента уже достигло уровня, который трудно отличить от натурных съёмок. Одно из рекламных агентств призналось FT, что по запросу клиента создало 100 000 различных видео, что традиционным способом было бы чрезвычайно дорого.

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости