Новости

Рейтинг российских платформ управления данными: кто заменил западные решения

Первый отечественный рейтинг платформ для управления данными, способных заменить продукты зарубежных поставщиков (таких как SAP, Oracle, IBM и Informatica), был представлен CNewsMarket. Сравнение систем проводится по более чем 100 показателям, охватывающим функциональные, архитектурные и технологические аспекты. Также анализируется качество модулей платформы для сбора, обработки и передачи информации, а также уровень сопровождения, предоставляемого вендором.

CNewsMarket выпустил эксклюзивный обзор российских DMP-платформ, созданных для комплексной работы с разнотипными корпоративными данными. Эти интегрированные решения дают возможность максимально задействовать накопленную информацию благодаря автоматизации всех этапов — от приема данных до генерации итоговых отчетов в различных аналитических срезах.

В ходе своей работы организации постоянно аккумулируют сведения о клиентах, конкурентах, рыночной ситуации и внутренних бизнес-процессах. Однако в большинстве случаев эти данные, поступающие из множества внешних и внутренних источников, остаются разрозненными и не объединенными в единое хранилище.

Платформы управления данными (Data Management Platform, DMP) служат для централизованного контроля над информационными активами, преобразуя разрозненные массивы в основу для аналитики и прогнозного моделирования. Полнофункциональные платформы предоставляют полный набор инструментов для приема, хранения, очистки, трансформации и распространения данных.

Сводный рейтинг сформирован на основе оценки по более чем 150 различным критериям. Помимо ключевой категории «Функциональность» (включающей около 70 параметров), рассматриваются такие аспекты, как масштабируемость, отказоустойчивость, применяемые технологии, качество технической поддержки, модели лицензирования и другие.

Для каждого параметра в рамках критериев разработана балльная система оценивания. Участники рейтинга распределяются по местам в зависимости от общей суммы баллов: чем она выше, тем лучше позиция. Детальная методика представлена в разделе «Правила начисления баллов».

Рейтинг российских платформ управления данными

Подробнее: Обзор «Российские платформы управления данными 2025»

Источник: ИТ-маркетплейс CNewsMarket, 2025 г.

Оценка продуктов осуществлялась по авторской методологии экспертов CNewsMarket, принимающей во внимание ряд ключевых параметров:

1. Возможности и функции:

2. Защищенность информации:

3. Техническая поддержка и развитие продукта:

4. Процесс внедрения и условия лицензирования:

Пятерка ведущих российских платформ для управления данными в 2025 году

Источник: CNewsMarket, 2025 г. Полный обзор

Первое место в обзоре отечественных DMP-платформ заняло комплексное решение «Фабрика данных» (Digital Q.DataFactory), входящее в экосистему Digital Q от «Диасофт». Этот продукт автоматизирует полный цикл обработки информации — от приема данных до машинного обучения и создания визуализаций. В основе платформы лежит архитектура Data Lakehouse, сочетающая сильные стороны классических хранилищ (Data Warehouse) и озер данных (Data Lake). Важным достоинством системы является low-code-подход к построению процессов работы с данными, что сокращает время разработки и упрощает работу для специалистов.

На второй позиции находится платформа Datareon Platform. Она интегрирует в себе функционал для ETL-процессов (извлечение, преобразование, загрузка), хранения данных, бизнес-аналитики (BI) и машинного обучения. К сильным сторонам решения относится поддержка как вертикального масштабирования (путем наращивания мощности сервера), так и горизонтального — через развертывание кластера. Кластер функционирует в режиме active-active, где все узлы одновременно участвуют в обработке задач, что исключает наличие единой точки отказа.

Бронзу получает lakehouse-платформа Data Ocean, созданная компанией Data Sapience. Ее архитектура дает возможность сформировать единую аналитическую среду, объединяя разрозненные источники данных для построения отчетности с обязательными процедурами контроля качества входящей информации. Разработчик (в составе ГК GlowByte) обладает многолетним практическим опытом создания и промышленной эксплуатации высоконагруженных систем обработки данных. Среди отличительных черт системы — поддержка четырех вычислительных движков: StarRocks, Trino, Impala и Spark.

Рейтинг составлен по балльной системе. Каждому продукту были присвоены баллы согласно оценочной таблице. Чем больше итоговое количество баллов, тем выше позиция в итоговом списке.

1.     Модули для работы с искусственным интеллектом

▪        Наличие платформы MLOps

▪        Обработка неструктурированных данных (распознавание изображений и текста в документах)

▪        Наличие крупных языковых моделей (LLM) для помощи в написании кода, создании ML-моделей и анализе данных


2.     Поддержка многофакторной аутентификации

1.     Инструменты управления метаданными, обеспечения качества данных, контроля доступа и соблюдения политик

▪        Автоматическое выявление и систематизация информации из разнообразных источников (СУБД, облачные сервисы, аналитические платформы и др.)

▪        Метаданные: агрегация, сохранение и администрирование метаинформации для всех объектов данных

▪        Администрирование доступа и настройка разрешений для пользователей

▪        Ведение истории изменений и фиксация всех модификаций данных

▪        Графическое отображение источников данных, этапов их обработки и перемещений между системами (обеспечение трассируемости данных)


2.     Обеспечение качества данных

▪        Профилирование данных: Исследование структуры, содержимого и статистических характеристик данных для обнаружения несоответствий

▪        Контроль и оценка уровня качества данных

▪        Дедупликация: Выявление и устранение повторяющихся записей

▪        Импутация: Заполнение пропущенных значений согласно заданным правилам или алгоритмам

▪        Валидация данных на соответствие корпоративным правилам и стандартам (к примеру, проверка корректности email-адресов)

▪        Контроль целостности: Проверка корректности связей между данными (например, внешних ключей в базах данных)

▪        Проверка форматов: Обеспечение соответствия данных ожидаемым форматам (например, чтобы числовые поля содержали исключительно числа)

▪        Автоматическая коррекция: Настройка правил для автоматического исправления выявленных ошибок

▪        Интеграция с ETL/ELT-процессами: Встраивание проверок качества данных в процедуры извлечения, преобразования и загрузки

▪        Учёт ошибок: Регистрация и категоризация выявленных в данных проблем

▪        Обработка исключений: Возможность ручного анализа и корректировки данных, не прошедших автоматическую проверку

▪        Управление доступом и маскирование конфиденциальных данных при необходимости


3.     Сохранение данных

▪        Гибридное хранение: Поддержка как структурированной, так и неструктурированной информации

▪        Партиционирование: Разделение данных на логические блоки для оптимизации производительности (например, по временным периодам или географическому признаку)

▪        Шардирование: Распределение данных между несколькими серверами с целью масштабирования

▪        Сжатие данных: Уменьшение занимаемого данными дискового пространства

▪        Репликация: Создание резервных копий данных на разных узлах для повышения отказоустойчивости

▪        Резервное копирование: Автоматическое или инициируемое пользователем создание резервных копий

▪        Восстановление данных: Возможность вернуть данные после сбоев или случайного удаления

▪        Кэширование: Размещение часто используемых данных в оперативной памяти для ускорения работы

▪        Масштабируемость: Возможность горизонтального (добавление новых серверов) и вертикального (увеличение ресурсов существующих серверов) масштабирования

▪        Снапшоты (Snapshots): Создание моментальных снимков состояния данных для резервного копирования и восстановления

▪        Проверка подлинности и управление доступом: Регулирование доступа к информации с учётом ролей и разрешений пользователей

▪        Протоколирование действий: Фиксация всех манипуляций с данными для контроля изменений и обращений

▪        Обфускация данных: Скрытие чувствительных сведений (например, персональных данных) от неавторизованных лиц

▪        Интеграция с объектным хранилищем S3: Способность сохранять информацию в виде объектов (файлы, изображения, видео и др.)

▪        Автоматическое перераспределение данных: Перемещение информации между уровнями хранения (к примеру, из S3 Standard в S3 Glacier для долгосрочного архивирования)

▪        Управление жизненным циклом данных S3: Автоматическое удаление информации из S3 по истечении заданного периода

▪        Совместимость с протоколами: Поддержка интерфейсов S3 API, HTTP/HTTPS

▪        Контроль обращений: Мониторинг доступа к данным S3 и их изменений

▪        Наблюдение за эффективностью S3: Отслеживание загрузки ресурсов хранения

▪        Анализ использования данных S3: Исследование паттернов работы с данными S3 для совершенствования хранилищ


4.     Обработка информации

▪        Программные интерфейсы (API): Обеспечение точек интеграции с внешними системами

▪        Соблюдение стандартов: Совместимость с SQL, ODBC, JDBC и иными общепринятыми спецификациями

▪        Выполнение комплексных запросов: Возможность проведения аналитических операций (OLAP)

▪        Обработка в режиме реального времени: Поддержка потокового анализа данных (например, с использованием Apache Kafka)

▪        Машинное обучение: Совместимость с фреймворками для ML

▪        Селекция данных: Извлечение информации по заданным параметрам (например, SQL-запросы с конструкцией WHERE)

▪        Аналитические операции: Поддержка сложных расчётов, таких как определение скользящих средних, выявление трендов и построение прогнозов

▪        Статистический анализ: Вычисление статистических метрик (дисперсия, корреляция, регрессия)

▪        Потоковая аналитика: Способность обрабатывать информацию в реальном времени (например, через Apache Kafka, Apache Flink)

▪        Распределённая обработка: Задействование кластеров для работы с крупными массивами данных (например, на базе Apache Hadoop, Spark)

▪        Параллельные расчёты: Одновременное выполнение операций на нескольких вычислительных узлах

▪        Обработка неструктурированной информации: Работа с текстовыми документами, изображениями, видеороликами и прочими неформатированными данными

▪        Поддержка многомерных структур данных

▪        Поддержка OLAP-операций

▪        Инструменты оптимизации производительности для OLTP (Тонкая настройка, Индексирование, Кэширование)

▪        Обеспечение ACID-свойств транзакций: атомарности (Atomicity), согласованности (Consistency), изолированности (Isolation) и устойчивости (Durability)

▪        Горизонтальное расширение: Возможность наращивания мощности за счёт добавления новых узлов для обработки увеличивающегося потока транзакций

▪        Вертикальное масштабирование: Добавление мощностей (таких как процессорные ядра, оперативная память) к текущим серверам


5.     Перемещение и обмен данными

▪        Получение информации из различных источников (например, СУБД, программные интерфейсы, файлы)

▪        Обработка данных (фильтрация, унификация, дополнение)

▪        Импорт данных в конечные системы (например, дата-хранилища, дата-озёра)

▪        Репликация данных: Синхронное или периодическое дублирование информации

▪        Потоковая обработка данных, работа с информацией в режиме реального времени

▪        Администрирование API: Разработка, размещение и контроль интерфейсов для обмена данными

▪        Управление системами очередей сообщений

▪        Наблюдение за состоянием платформы данных

▪        Контроль загрузки процессора, памяти, дисков и сетевых соединений

▪        Мониторинг производительности серверов и элементов кластера

▪        Статус кластера: Проверка работоспособности узлов в распределённых системах (например, Hadoop, Kubernetes)


6.     Персональный раздел (единый центр управления платформой)

▪        Импорт данных: Загрузка информации из файлов (CSV, JSON, XML) или через API

▪        Экспорт данных: Выгрузка информации в разных форматах для анализа или передачи в сторонние системы

▪        Оповещения: Сигналы о нарушениях в качестве данных

▪        Поиск по данным: Функция поиска информации через метаданные (например, имя таблицы, комментарии)

▪        Аннотация данных: Просмотр и изменение метаданных (например, описаний таблиц и полей)

▪        Происхождение и аудит данных (Data Lineage)

▪        Визуализация: Графическое представление источников и трансформаций данных

▪        Распределение ролей: Контроль прав доступа на основе ролевой модели (например, администратор, аналитик)


7.     Обеспечение работы компонентов платформы в контейнерах

▪        Запуск и функционирование платформы в кластере контейнеров или многоконтейнерной инфраструктуре

▪        Kubernetes

▪        K3S

▪        Docker Compose


8.     Организация запуска и работы

▪        Централизованное и децентрализованное применение конфигураций платформы

▪        Возможность запуска и выполнения в разнородной (разные ОС для различных узлов и компонентов) вычислительной и хранилищной среде


9.     Масштабируемость, бесперебойность и устойчивость к сбоям

▪        Горизонтальное масштабирование путём управления количеством экземпляров сервисов и узлов

▪        Вертикальное масштабирование за счёт увеличения аппаратных ресурсов

▪        Процедуры резервного копирования и восстановления платформы, её параметров и информации, участвующей в интеграционных процессах

▪        Распределение входящего потока запросов для равномерной нагрузки

▪        Установка и контроль ограничений на использование ресурсов

10.     Обеспечение работы в кластерных аппаратных и программных средах

▪        Конфигурация Active-Standby

▪        Конфигурация Active-Active


11.     Ведение журналов и аудит

▪        Системное логирование событий

▪        Формирование графа реального движения данных на основе записей в журналах

▪        Фиксация изменений в конфигурации приложения (обрабатывающие процедуры, интеграционные потоки, объекты данных, соединители)

▪        Ведение и настройка администратором системы журнала аудита пользовательских операций

▪        Ведение журнала входа пользователей в систему

▪        Встроенная защита системных журналов событий от удаления, изменения или подмены без разрешения

▪        Настройка разных уровней детализации логирования

▪        Факт доступа или попытка доступа к защищенному действию, объекту или отчету

▪        Неправомерный доступ к информации


12.     Интерфейс пользователя, формы и поиск

▪        Графический конструктор для создания экранных форм для пользователей, построенный на принципах low-code

▪        Поиск по содержимому данных

▪        Поиск по системным объектам и разделам


13.     Проверка подлинности

▪        Аутентификация и предоставление прав пользователям (конечным, администраторам, разработчикам) по технологии единого входа (Single Sign-On)


14.     Поддерживаемые протоколы аутентификации:

▪        SAML 2.0

▪        SSL

▪        OpenID Connect (OIDC)

▪        Kerberos


15.     Поддерживаемые методы аутентификации:

▪        Проверка по логину и паролю, хранящимся в приложении

▪        Аутентификация с использованием токена

▪        Поддержка механизмов доменной аутентификации и ролей LDAP

▪        Поддержка механизмов доменной аутентификации и ролей Keycloak


16.     Применение гибкой модели управления доступом (RBAC, ABAC) и возможность разделения прав:

▪        Для разработчиков интеграций — настройка прав для потоков и элементов интеграций, параметров компонентов, инструментов разработки и отладки

▪        Для администраторов интеграционной платформы — настройка прав для системных и конфигурационных параметров, функций управления элементами и компонентами

▪        Для специалистов и бизнес-пользователей, в том числе для просмотра истории, аналитических отчетов, материалов, а также для обработки и переадресации передаваемых сведений и сообщений

▪        Для рабочих процессов и интеграционных модулей — к вычислительным мощностям и внешним системам


17.     Шифрование и защита информации

▪        Шифрование данных в хранилищах

▪        Шифрование конфигурационных файлов и параметров

▪        Использование симметричного шифрования

▪        Использование асимметричного шифрования

▪        Применение хеширования

▪        Гарантия и контроль соблюдения отраслевых стандартов и нормативов безопасности

18.     Технологический стек и совместимость с импортонезависимым системным программным обеспечением

▪        Соответствие действующим требованиям регулятора для попадания в реестр отечественного ПО (функционирование на российских или импортонезависимых СУБД, либо кроссплатформенность — работа с импортными, импортонезависимыми и российскими операционными системами и СУБД)

▪        Соответствие актуальным рекомендациям регулятора (работа на российских и импортонезависимых ОС, а также применение отечественной или импортонезависимой среды разработки)


19.     Число выполненных проектов по внедрению платформы

20.     Число проектов по миграции

21.     Численность сотрудников компании, задействованных в разработке и совершенствовании продукта

22.     Численность сотрудников компании, работающих в службе поддержки

23.     Сервис поддержки

▪        Наличие нескольких линий технической поддержки (более одной)

▪        Сообщество для разработчиков (в социальных сетях и других ресурсах), курируемое поставщиком

▪        Публичный доступ к руководствам (для администратора и пользователя)


24.     Модели лицензирования

▪        OnPremise-модель (на собственных серверах)

▪        Размещение платформы в приватном облаке

▪        Гибридная модель (OnPremise и облако)

Поддержка развертывания компонентов платформы на различных операционных системах

▪        Windows

▪        RedHat Linux (RHEL)

▪        Oracle Linux

▪        Российские дистрибутивы Linux — Astra, ALT, РЕД ОС


От 1 до 5 проектов = 5 баллов

От 6 до 15 проектов = 10 баллов

От 16 до 50 проектов = 15 баллов

От 1 до 5 проектов = 10 баллов

От 1 до 10 человек = 10 баллов

От 11 до 50 человек = 15 баллов

От 1 до 5 человек = 5 баллов

От 6 до 15 человек = 10 баллов

Перейти к обзору «Российские платформы управления данными 2025»

Отзывы о рейтинге и обзоре можно отправить на электронную почту , указав в теме письма пометку DMP.

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории