Ассоциация больших данных выступила с инициативой по внесению изменений в действующее законодательство. По мнению ее участников, без этих правок легальный обмен наборами данных в России затруднен, что, в свою очередь, сдерживает прогресс в области искусственного интеллекта из-за дефицита информации для обучения алгоритмов.
Как сообщает «Коммерсант», Ассоциация больших данных (АБД, в которую входят ведущие IT-компании, включая «Яндекс», VK, Сбербанк, «МегаФон», «Ростелеком», МТС) направила в Минцифры обращение. В нем предлагается исправить пробелы в нынешнем правовом регулировании сферы ИИ, которые препятствуют свободному обороту информации.
В частности, в АБД обратили внимание на то, что любая передача сведений может трактоваться как противозаконная из-за нечетких критериев отнесения информации к персональным данным или, например, к банковской тайне, даже если эти данные были обезличены или зашифрованы необратимым способом.
«Без подобных уточнений любая передача данных формально оказывается вне правового поля, что серьезно замедляет развитие аналитики и технологий искусственного интеллекта», — отметили в ассоциации. Они уточнили, что текущие нормы о защите персональных и конфиденциальных данных запрещают их передачу за пределы инфраструктуры оператора, объединение сведений, собранных для разных задач, и даже необратимое обезличивание без разрешения субъекта.
Еще одной сложностью, по оценке АБД, является отсутствие унифицированных стандартов для открытых API по модели Open Data. Это мешает эффективному взаимодействию и обмену данными между компаниями из различных секторов, такими как телекоммуникационные операторы, маркетплейсы и финансовые организации.
«Подобный дисбаланс и отсутствие межотраслевого обмена данными ограничивают их циркуляцию, доступность и разнообразие, необходимые для обучения ИИ-моделей. Это сдерживает конкурентное развитие, совершенствование клиентского сервиса и создание новых инновационных продуктов и услуг на основе данных», — указано в обращении к Минцифры.
АБД предлагает признать наборы данных (датасеты) объектом имущественных прав. Такой шаг позволит раскрыть их потенциал в качестве ценного актива и сформирует легальный рынок для их обращения. Кроме того, использованию государственных данных мешает отсутствие понятной и предсказуемой системы тарифов на доступ к ним.
С мнением о дефиците данных для обучения ИИ согласна руководитель направления по работе с регуляторами Swordfish Security Альбина Аскерова. Если барьеры для доступа к информации не будут устранены, развитие генеративного ИИ в России упрется не в качество алгоритмов, а в ограниченность «сырьевой базы», отметил независимый эксперт в области ИИ Алексей Лерон.
Тем не менее, не все участники рынка могут поддержать планируемые нововведения. По мнению Алексея Штейгера, руководителя департамента технической поддержки Hybrid, концепция масштабного обмена данными, несмотря на возможность сократить издержки и убрать избыточные операции, способна встретить противодействие со стороны крупного бизнеса, в частности банков и торговых площадок, для которых информация представляет собой ценный актив и основу для конкурентного превосходства.
Еще один потенциальный барьер отметил Тимофей Хорошев, партнер практики технологического консультирования ДРТ. Он считает, что стремительная реализация проектов подобного уровня маловероятна: каждый отдельный случай нуждается в детальном изучении и поддержке, а существующие экспериментальные форматы зачастую не поспевают за скоростью технологического прогресса.
