Ксения Бокша из VK: Перспективы связаны с аналитикой на естественном языке и агентами на базе ИИ
Ксения Бокша
Руководитель направления по аналитике данных
В современном мире обработка больших данных выходит за рамки простого обслуживания хранилищ. В масштабных ИТ-системах, которые работают с миллионами пользователей онлайн, управление информацией становится самостоятельным направлением. От его эффективности напрямую зависит развитие компании, поэтому всё большее значение приобретает встраивание аналитических инструментов в бизнес-процессы и их способность обеспечивать обоснованное принятие решений. Руководитель направления по аналитике данных VK Ксения Бокша поделилась взглядом на отраслевые тенденции и рассказала, как сделать данные реальным рабочим ресурсом.
Основные направления развития
На протяжении долгого времени в крупных технологических компаниях разные отделы создавали собственную инфраструктуру. Это приводило к расхождениям в показателях и повторению вычислений. Естественным решением стал переход к платформенному подходу, из которого сформировались четыре главных тренда:
- Создание систем самостоятельного доступа для бизнес-пользователей (self-service инструменты);
- Широкое применение искусственного интеллекта в аналитике;
- Гибкая, адаптируемая инфраструктура;
- Повышенное внимание к качеству информации.
В VK таким инструментом стала единая платформа OneData. Её задача — объединить технологический стек для аналитики, машинного обучения и продуктовых команд. Платформа организована вокруг централизованного хранилища данных, куда постепенно подключаются все бизнес-подразделения. Это позволяет консолидировать аналитику в одном пространстве, рассчитывать сквозные метрики и избегать излишних затрат на поддержку разрозненных систем.
Доступность данных: аналитика для всех, а не только для специалистов
Появление мощных языковых моделей существенно упрощает начало работы в сфере аналитики. Теперь специалисты по анализу данных, разработчики и продуктовые команды могут извлекать ценную информацию напрямую с помощью запросов на обычном языке, минуя необходимость писать SQL-код. Как отмечается в прогнозе Gartner, к 2027 году три четверти нового аналитического контента будет производиться с применением технологий генеративного искусственного интеллекта.
В основе интерфейсов для запросов на естественном языке в VK лежат специально дообученные модели, адаптированные под конкретные бизнес-задачи. Это позволяет распространить экспертизу в области машинного обучения на все подразделения компании. К примеру, уже в феврале 2026 года ИИ-помощники для аналитиков позволили сэкономить 1300 рабочих часов в выборке из 400 пользователей. Операции, ранее занимавшие 20 минут, теперь выполняются всего за пять.
Роль искусственного интеллекта и машинного обучения в аналитике
Модели машинного обучения и ИИ-агенты уже берут на себя рутинную работу: аннотирование данных, написание кода и подготовку документации. В ближайшей перспективе значительно возрастёт количество запросов, формулируемых на простом языке. SQL останется отраслевым стандартом, но его функция трансформируется: он станет языком взаимодействия искусственного интеллекта с информационными массивами.
Однако важно понимать, что пока нельзя полагаться на модели так же, как на людей. Основная трудность заключается в сложности обнаружения их ошибок. Если в сгенерированном видео «артефакты» ИИ часто заметны, то в аналитике ситуация иная: здесь галлюцинации выглядят правдоподобно и их почти невозможно отличить от достоверных данных. При этом даже незначительная погрешность может привести к абсолютно неверному выводу.
Для минимизации риска галлюцинаций мы внедряем системы проверки и фильтры контроля качества данных. Используется гибридный подход: одна модель оценивает результаты другой, часть кейсов проверяется вручную, отдельно верифицируются источники. Таким образом, ответы искусственного интеллекта проходят сверку с эталонными метриками ещё до их включения в отчёты.
Централизованная инфраструктура данных
Децентрализованная архитектура, долгое время считавшаяся удобной для автономных команд, сегодня становится препятствием для полноценной интеграции ИИ. Разобщённые хранилища неизбежно приводят к фрагментации контекста, который крайне важен для обучения крупных моделей и функционирования алгоритмов. Отрасль движется к стандартизации обмена данными через специальные контракты. В VK этот принцип реализуется через строгие соглашения об уровне сервиса: поставка критически важных данных уровня P0 должна быть технически гарантирована, а любые сбои немедленно становятся приоритетом для устранения в рамках разработки.
В результате меняется сама суть инфраструктуры. Поэтапный вывод из эксплуатации устаревших разрозненных систем высвобождает серверные ресурсы, которые можно перенаправить на решение более важных задач. Например, на обучение генеративных моделей или запуск инновационных сервисов.
Экономика качества
Простой сбор информации в больших объёмах больше неэффективен. Сегодня ключевое значение имеют постоянный контроль и ясность данных на каждом этапе их обработки. Без встроенных механизмов проверки огромные информационные массивы рискуют стать цифровым хаосом. Если раньше неточные сведения в основном искажали аналитические отчёты, то теперь они способны провоцировать целые серии ошибочных действий у систем искусственного интеллекта.
В сфере больших данных широко известно правило 1–10–100: устранение ошибки в источнике обходится примерно в $1, её очистка в хранилище — уже в $10, а убытки от решения, принятого на основе некорректных данных, начинаются от $100. С распространением технологий ИИ этот дисбаланс будет лишь усиливаться.
Характерный пример из опыта крупных компаний: при традиционном подходе сбой в передаче журналов событий от важного сервиса может не обнаруживаться несколько дней — и стать заметным лишь при падении ключевых бизнес-показателей. Чтобы исключить подобные «слепые пятна», всё чаще применяют автоматизированный контроль качества данных (DQ-проверки) в режиме реального времени и системы отслеживания их происхождения. Сегодня вложения в обеспечение качества — это не просто страховка, а фундаментальное требование для функционирования ИИ и один из главных элементов операционной эффективности.
Взгляд вперёд
С развитием агентного ИИ взаимодействие с данными приобретает характер диалога. Согласно прогнозу Gartner, к 2027 году искусственный интеллект будет участвовать в формировании половины бизнес-решений, предлагая конкретные стратегии (Decision Intelligence). Этот переход подтверждается включением мультиагентных систем (MAS) в десятку главных технологических трендов на 2026 год.
Мы наблюдаем отход от модели, где аналитик самостоятельно формирует запросы. Как отмечается в прогнозе Forrester, к концу 2026 года корпоративное программное обеспечение станет средой, где ИИ-агенты самостоятельно инициируют действия и автономно управляют операциями.
Планируется активнее внедрять ИИ для принятия решений в рутинных ситуациях и теснее интегрировать отслеживание показателей с процессами выпуска обновлений. Система сможет, к примеру, информировать руководителя о связи между обновлением продукта и изменением метрик: «После внедрения компонента X зафиксировано отклонение показателя Y. Подтвердите продолжение выполнения сценария». Таким образом, аналитика перестаёт быть лишь инструментом наблюдения и становится частью системы управления. Меняются и роли специалистов: они всё реже ведут проекты от старта до финала и всё чаще выступают в качестве контролёров или кураторов для систем: оценивают работу моделей и корректируют их. Чем совершеннее становится ИИ, тем более сложные и самостоятельные цепочки задач предстоит проверять человеку.
Ключевая задача — освоить передачу заданий автоматизированным системам и корректно определять степень их надежности. Допустимо ли полностью поручить искусственному интеллекту создание программного кода? В принципе, да. Однако при возникновении сбоев будет трудно выявить точное место и причину ошибки. Для разработки промышленного кода это представляет значительную угрозу. В сфере аналитики положение несколько проще, но окончательная ответственность за итоги и принятые решения по-прежнему лежит на специалисте.