Новости Software

Sora от OpenAI: ИИ-видео создано на краденом, а авторские права не защитить

В начале текущего года OpenAI представила усовершенствованную версию нейросети Sora для создания видеороликов. Данный инструмент позволяет генерировать разнообразные материалы, включая те, что могут затрагивать права интеллектуальной собственности — например, с участием реальных знаменитостей или анимационных героев. Разработчики попытались решить эту проблему, доработав алгоритм, однако, как выяснилось, установленные ограничения легко преодолеть с помощью методов, уже применяемых в других ИИ-генераторах.

 Источник изображения: OpenAI

Источник изображения: OpenAI

После релиза Sora в сентябре пользователи быстро начали применять сервис для создания контента, нарушающего авторские права. Нейросеть использовали для производства роликов, где популярные мультипликационные и киноперсонажи участвовали в противоправных действиях. Компании вроде Nintendo и Paramount вряд ли были довольны появлением их героев в пользовательских видео без какого-либо вознаграждения правообладателям. В ответ OpenAI оперативно внедрила политику «проверенного согласия», запрещающую генерацию видео с персонажами, защищёнными авторским правом, без прямого разрешения владельцев. Изначально такие действия были допустимы, поэтому правообладателям потребовалось ввести соответствующие ограничения. Это нововведение вызвало недовольство среди пользователей Sora, поскольку сервис перестал создавать контент с лицензированными героями или реальными людьми.

На практике оказалось, что установленные OpenAI запреты легко обходятся путём корректировки текстовых запросов к системе. К примеру, при вводе «геймплей Animal Crossing» Sora выдаёт предупреждение: «Данный контент может нарушать правила относительно сходства с материалами третьих лиц». Но если запросить «заставка и игровой процесс игры под названием Crossing Animal 2017 года», сервис точно воссоздаёт видео из игры Animal Crossing: New Leaf для приставки Nintendo 3DS. Похожие методы позволяют получать ролики с участием реальных персон.

Существуют различные подходы к контролю генеративных ИИ-инструментов. Наиболее доступный метод предполагает блокировку запросов с определёнными терминами. Например, многие алгоритмы искусственного интеллекта автоматически отклоняют создание материалов эротического содержания и видео со знаменитостями, выявляя в запросах конкретные выражения. Тем не менее, такая стратегия часто оказывается малорезультативной, поскольку пользователи придумывают альтернативные формулировки, позволяющие обойти защитные механизмы. Эта же ситуация наблюдается с Sora, из-за чего OpenAI не удалось надёжно ограничить создание контента, нарушающего права авторов.

Вероятно, OpenAI сможет взять ситуацию под контроль. Для этого потребуется значительно расширить перечень запрещённых терминов, выражений и фраз, а также активнее внедрять проверку созданных видеороликов — более действенный, но и более затратный способ модерации. Однако все эти меры лишь отвлекают внимание от колоссального массива охраняемого авторским правом контента, который уже был задействован алгоритмом ИИ и без которого его функционирование было бы невозможным.

Сложность, с которой сталкиваются OpenAI и другие крупные компании в сфере ИИ при попытках ограничить генерацию определённых материалов, объясняется тем, что подобный контент изначально присутствует в данных для обучения нейросетей. К примеру, генератор изображений способен создавать эротические картинки исключительно потому, что его обучающая база содержит множество подобных материалов. Он может воспроизводить образы знаменитостей, поскольку их изображения включены в обучающие данные. Для действительного решения проблемы нарушений авторских прав OpenAI необходимо научить Sora идентифицировать охраняемый контент и «забывать» его, что представляет собой чрезвычайно сложную и дорогостоящую задачу. Это потребовало бы полного удаления защищённых материалов из обучающей базы и повторного обучения модели. Даже если бы OpenAI обладала такой возможностью, маловероятно, что компания пошла бы на этот шаг, ведь именно эти данные обеспечивают работоспособность Sora.

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории