Издатели «Британской энциклопедии» (Encyclopedia Britannica) и словарей Merriam-Webster подали судебный иск против OpenAI. По их мнению, компания применяла материалы, защищённые авторскими правами, для обучения своих нейросетей, после чего ИИ формировал ответы, имеющие «существенное сходство» с оригинальными текстами. Об этом информирует агентство Reuters.
Источник изображения: Levart_Photographer / unsplash.com
Представители «Британники» заявляют, что OpenAI систематически использовала их контент без получения соответствующего разрешения. «GPT-4 фактически “запомнила” значительные объёмы охраняемых авторским правом материалов энциклопедии и способна воспроизводить почти идентичные, обширные фрагменты текста по запросу. Эти сохранённые данные представляют собой неавторизованные копии, которые [OpenAI] применяла в процессе обучения своих моделей, включая GPT-4», — указывается в исковом заявлении.
В документе также приведены сравнения ответов, сгенерированных моделями OpenAI, с оригинальными текстами энциклопедии, где целые абзацы совпадают дословно. Кроме того, «Британника» утверждает, что действия OpenAI приводят к сокращению её веб-трафика, поскольку ИИ создаёт ответы, которые «подменяют или напрямую соперничают» с контентом энциклопедии, вместо того чтобы перенаправлять пользователей на её сайт, как это происходит при использовании обычных поисковых систем.
Как отмечает The Verge, этот иск стал очередным в череде растущего числа судебных разбирательств о нарушении авторских прав, которые издатели инициируют против компаний, работающих в сфере искусственного интеллекта. Ранее The New York Times выдвинула схожие претензии в своём продолжающемся деле против OpenAI, обвиняя компанию в масштабном копировании охраняемых материалов. В сентябре компания Anthropic урегулировала коллективный иск об использовании защищённых авторским правом книг для обучения своих ИИ-моделей, выплатив авторам компенсацию в размере $1,5 млрд.