Новости Software

Reddit в суде против ИИ-стартапа: обвинения в краже данных

Социальная сеть Reddit инициировала судебное разбирательство против компании Perplexity и трёх провайдеров услуг по сбору веб-данных — SerpApi, Oxylabs и AWMProxy, утверждая, что они осуществляют массовый несанкционированный сбор защищённой информации с платформы для обучения систем искусственного интеллекта. В документе указывается, что Perplexity, создатель поисковой системы на базе ИИ, получает контент через этих посредников, вместо того чтобы подписать прямые лицензионные соглашения с Reddit, как поступили другие игроки в сфере искусственного интеллекта.

 Источник изображения: Reddit

Источник изображения: Reddit

Как сообщает The Verge, согласно материалам иска, в мае 2024 года Reddit направил Perplexity официальное уведомление о прекращении сбора информации, на что получил ответ, что компания не применяет данные Reddit для тренировки алгоритмов и соблюдает ограничения, указанные в файле robots.txt. Тем не менее, как заявляет истец, вскоре после этого объём упоминаний материалов Reddit в ответах Perplexity заметно увеличился.

Reddit акцентирует, что многомиллионный архив пользовательских обсуждений обладает высокой ценностью для развития ИИ-технологий, и ранее уже заключила партнёрские соглашения с OpenAI и Google, а также ввела в 2023 году платный программный интерфейс, стремясь монетизировать использование своего контента.

Генеральный юрисконсульт Reddit Бен Ли заявил, что «разработчики технологий искусственного интеллекта вовлечены в ожесточённую конкуренцию за человеческий контент высокого качества, что спровоцировало формирование масштабной системы "отмывания цифровых данных"». Он охарактеризовал литовскую компанию Oxylabs UAB, ботнет-инфраструктуру AWM Proxy и SerpAI, публично предлагающие методы обхода защитных механизмов, как характерных участников подобной противоправной деятельности. По его словам, эти организации, не имея легального доступа к Reddit, маскируют свои скрипты и географическое положение, чтобы извлекать контент через поисковые результаты Google, а Perplexity целенаправленно приобретает эту незаконно полученную информацию, уклоняясь от правомерного сотрудничества.

Со своей стороны, руководитель коммуникаций Perplexity Джесси Двайер сообщил The Verge, что компания пока не получила судебный иск, но готова активно защищать право пользователей на свободный и равноправный доступ к общедоступным знаниям. Он подчеркнул, что подход Perplexity остаётся этичным и последовательным, а попытки ограничить открытость информации и общественные интересы компания не намерена принимать.

Ранее Reddit также подала иск против Anthropic по схожим причинам, заявляя, что боты компании получили доступ к её платформе, несмотря на заверения Anthropic о воздержании от подобных действий.

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории