Аналитика

S3 как бизнес-архитектура: почему хранилище данных должно быть стратегическим активом

Перейти к обзору
Александр Гришин, Selectel: Объектное хранилище S3 должно быть не просто «складом для информации», а элементом бизнес-инфраструктуры

Количество корпоративных данных увеличивается стремительно — параллельно растет и потребность в актуальных методах их сохранения. Видеоконтент, журналы событий, аналитические сведения, медиафайлы, резервные копии — в этих случаях классические подходы уже неэффективны. Объектные хранилища превращаются в центральную технологию для адаптивного, расширяемого и бюджетного хранения. О том, почему компаниям необходима мультирегиональность при работе с данными, в каких ситуациях выбирать выделенное хранилище и какие возможности появятся в S3 в обозримой перспективе, CNews рассказал руководитель по развитию продуктов хранения данных Selectel Александр Гришин.

«Универсальный инструмент, решающий множество задач»

CNews: Объектное хранилище S3 — одно из фундаментальных решений для обработки неструктурированной информации. Каковы его основные принципы функционирования и чем оно выделяется на фоне классических блочных систем хранения?

Александр Гришин: S3 — это современная концепция хранения неструктурированных и частично структурированных данных, созданная для масштабирования, повышенной доступности, географического распределения и устойчивости к сбоям.

В отличие от блочных систем, где информация делится на блоки заданного размера и требует операционной или файловой системы для организации, объектное S3-хранилище обрабатывает данные как независимые объекты. Каждый объект включает само содержимое (полезную нагрузку), уникальный идентификатор (ключ) и набор метаданных, по своему устройству напоминая key-value базы данных.

Эти особенности напрямую определяют ключевые показатели эффективности. Для блочных систем хранения главными критериями служат IOPS (операции ввода-вывода в секунду) и время отклика (Latency), что предопределяет их выбор для задач виртуализации или СУБД. В свою очередь, для S3 основными характеристиками являются общая пропускная способность, скорость сетевого соединения и число запросов в секунду (RPS). Эта технология создана для хранения огромных массивов информации (bulk storage), где задержки не играют решающей роли.

С функциональной точки зрения S3-хранилище также имеет фундаментальные отличия. Прежде всего, оно изначально создавалось как облачный сервис, предоставляющий лёгкий доступ к данным из любой точки планеты через HTTP API. Этим объясняется, почему подавляющая часть медиаконтента в сети — видео, аудио, изображения — размещается именно на S3.

Кроме того, в S3 отсутствует традиционная древовидная структура папок и файлов: всё пространство организовано как плоская система, где доступ к объектам осуществляется по уникальной паре из имени бакета и ключа объекта. Такой подход упрощает управление хранением и увеличивает гибкость при работе с информацией. Также S3 поддерживает простое горизонтальное масштабирование, позволяя накапливать эксабайты данных. Это особенно ценно для работы с крупными массивами информации, такими как архивы, бэкапы, медиафайлы или данные с IoT-устройств.

Немаловажным фактором является и экономическая эффективность. На сегодняшний день индустрия не предлагает более бюджетного метода хранения данных, чем объектное хранилище S3. К примеру, 100 гигабайт в «холодном» хранилище могут обходиться дешевле 100 рублей в месяц — при этом обеспечивается высокая степень надёжности и отказоустойчивости.

Таким образом, S3 — это масштабируемое, облачное и экономичное решение, оптимально подходящее для работы с большими объёмами неструктурированных данных в тех случаях, когда в приоритете доступность и надёжность, а не сверхнизкая задержка.

Действительно, хранение неструктурированных данных остаётся самым распространённым сценарием использования S3. Однако в последнее время его применение стало шире. Благодаря таким инструментам, как SQL-движки (Trino, Presto и другие) и системам хранения метаданных в формате Iceberg, S3-хранилище сейчас становится одним из лучших вариантов и для структурированных данных. Тем самым оно начинает конкурировать на рынке распределённых СУБД, таких как OpenSearch, ClickHouse, Greenplum и аналогичные.

CNews: Какие основные бизнес-задачи помогает решать S3-хранилище Selectel? С какими типовыми сценариями его применения чаще всего сталкиваются ваши клиенты?

Александр Гришин: Хранилище не должно быть просто «складом для информации», а обязано стать элементом архитектуры бизнеса. Для компаний оно служит основой для создания устойчивых к сбоям, легко масштабируемых, адаптивных и при этом бюджетных систем хранения. Его конструкция и полная совместимость API с S3 дают возможность без проблем встроить его в текущую инфраструктуру, а распределенность по регионам и возможности, например, управления версиями, гарантируют отказоустойчивость и сохранность данных.

Одна из наиболее востребованных бизнес-задач, которую решает S3 — это обеспечение резервирования информации и защита от катастроф. Хранилище позволяет надёжно сохранять резервные копии в различных географических зонах и типах хранения — будь то горячее, холодное или ледяное. Благодаря функции версионирования можно обезопаситься от случайного удаления или изменения файлов, что крайне важно в бизнес-критичных ситуациях.

Ещё одна распространённая область применения — долгосрочное архивное хранение. Классы холодного и ледяного хранения наиболее выгодны по затратам для редко используемых данных, таких как финансовая документация, медицинские архивы, материалы исследований или видео, которые необходимо хранить на протяжении многих лет.

Третье направление — размещение мультимедийных файлов и статического контента. Многие заказчики применяют S3 в качестве бэкенда для сетей доставки контента (CDN) — для распространения изображений, видео и статических элементов веб-приложений. Это особенно важно для организаций с высоконагруженными сайтами и медиасервисами.

Следующий значимый вариант использования — обработка данных и аналитика, включая структурированные данные. S3 часто выступает в роли платформы для хранения исходных наборов данных — логов, телеметрии, дампов баз данных. Эта информация затем обрабатывается аналитическими системами, такими как Spark или Trino, напрямую, без необходимости предварительного копирования.

И, наконец, лёгкая интеграция с уже работающими системами — ещё одно ключевое достоинство. Благодаря полной совместимости с AWS SDK (набором инструментов для разработчиков) и обилию готовых библиотек, S3 можно просто подключить к CI/CD-процессам, системам резервного копирования, BI-инструментам, облачным платформам и CDN-провайдерам. Это делает его универсальным решением для самых разных компаний — от начинающих стартапов до крупных корпоративных клиентов.

Таким образом, перед нами надёжный инструмент, который решает широкий круг задач: от хранения резервных копий и медиафайлов до создания аналитических платформ и гибкого взаимодействия с любыми ИТ-окружениями.

«Наше решение даёт максимально высокий уровень безопасности, особенно актуальный для отраслей с жестким регулированием»

CNews: В этом году вы расширили возможности S3 хранилища и сделали его мультирегиональным. Что это означает для бизнеса и в чем техническое преимущество такого подхода?

Александр Гришин: В минувшем году компания Selectel внедрила в своём S3-хранилище функцию мультирегиональности. Теперь пользователи могут распределять информацию между несколькими физическими локациями. Архитектура и программный интерфейс при этом остаются общими, что открывает для бизнеса новые горизонты в вопросах отказоустойчивости и скорости работы.

Практическая польза такого подхода заключается в значительном повышении устойчивости к катастрофам: информация дублируется в географически независимых зонах. Это сводит к минимуму угрозу утраты данных из-за инцидентов в дата-центрах, проблем на линиях связи или локальных сбоев в определённых регионах. Подобная архитектура становится ключевой для организаций, предъявляющих строгие требования к соглашениям об уровне обслуживания (SLA) и бесперебойности рабочих процессов.

Помимо этого, мультирегиональная модель благоприятно сказывается на быстродействии. Хранение данных вблизи от конечных потребителей сокращает время отклика (латентность) и ускоряет доступ к контенту, что особенно важно при обработке значительных массивов информации.

С технической точки зрения мы создали универсальный глобальный API. Он выступает в роли единой точки доступа для взаимодействия со всеми регионами, избавляя от необходимости привязываться к конкретному месту физического размещения данных.

Также доступно использование регионального эндпоинта (https://s3.ru-3.storage.selcloud.ru) для ускоренного получения доступа к информации.

Стоит подчеркнуть, что мультирегиональная функциональность разработана на основе нашего собственного программного обеспечения. Это даёт нам полный контроль над архитектурой, позволяет проводить глубокую оптимизацию под нужды заказчиков и гарантирует стопроцентную совместимость с публичной спецификацией AWS S3.

CNews: Для крупных заказчиков, особенно с повышенными требованиями к защищённости, вы предоставляете выделенное S3-хранилище. Как оно организовано и чем выгодно отличается от публичного решения?

Александр Гришин: Selectel предлагает услугу выделенного объектного S3-хранилища (Dedicated S3), которое физически обособлено от публичной инфраструктуры и предназначено для клиентов, нуждающихся в усиленных мерах безопасности, полном контроле и высокой производительности.

Технически это решение базируется на выделенных серверных мощностях — как на уровне систем хранения (бэкенда), так и на уровне фронтальных шлюзов S3 API. Каждый клиент получает персональную точку доступа (эндпоинт), размещённую в выбранном одном или нескольких регионах — все ресурсы обслуживают исключительно одного арендатора, без «соседства» на оборудовании или в сети. При этом используется тот же S3-протокол и API, что и в публичном варианте, что обеспечивает полную совместимость с уже используемыми инструментами (агентами резервного копирования, SDK, CDN, BI-системами).

Пользователям предоставляется полный набор базовых возможностей: различные классы хранения данных (от горячего до холодного), управление версиями, настройка политик доступа, поддержка мультирегиональности. Исходя из рабочих нагрузок, мы предлагаем оптимальную аппаратную платформу: от традиционных HDD до скоростных NVMe SSD, с разными вариантами репликации информации.

Для компаний ключевым преимуществом является выделенная инфраструктура — наивысший уровень защищенности, что особенно важно для строго регулируемых сфер: финансовых технологий, государственных учреждений, здравоохранения. Ресурсы не делятся между клиентами — всё оборудование закреплено исключительно за одним заказчиком.

Это обеспечивает абсолютный контроль над платформой: можно самостоятельно устанавливать ограничения, конфигурировать правила, управлять сетевыми настройками и получать доступ к системным журналам и метрикам.

Особо следует выделить гарантированную производительность. Благодаря отсутствию общего использования ресурсов и возможности детальной настройки достигается стабильно высокая эффективность: до 100 000 операций в секунду и пропускная способность до 200 Гбит/с на один развернутый экземпляр.

Кроме того, мы обеспечиваем индивидуальную интеграцию и расширенные соглашения об уровне сервиса (SLA): вплоть до выделенных каналов связи, гибридных конфигураций с локальными решениями и персональной технической поддержки.

CNews: Расскажите об аттестованном хранилище Selectel. Для каких задач оно предназначено и какие сертификаты подтверждают его соответствие стандартам информационной безопасности?

Александр Гришин: Аттестованное хранилище Selectel разработано в соответствии с нормами российского законодательства в сфере ИБ и ориентировано на клиентов, которым необходимо хранить и обрабатывать персональные или конфиденциальные данные согласно регуляторным требованиям, включая закон 152-ФЗ, а также приказы ФСТЭК №17 и №21.

Оно функционирует на изолированной инфраструктуре в московском дата-центре на Берзарина, прошедшем официальную аттестацию. Все защитные механизмы реализованы с применением сертифицированных средств защиты информации. Инфраструктура работает в изолированном контуре с контролем доступа, шифрованными каналами передачи, аудитом событий и возможностью подключения систем DLP, VPN и мониторинга.

При этом оно полностью поддерживает Amazon S3 API и включает все основные функции: управление версиями объектов, политики доступа, различные классы хранения и работу через стандартные SDK.

Аттестация получена по требованиям ФСТЭК России. Хранилище соответствует первому уровню защищенности персональных данных, что позволяет обрабатывать ПДн 1–4 категорий. Также подтвержден первый класс защищенности для государственных информационных систем.

Данное решение, в первую очередь, востребовано государственными и муниципальными структурами — при развертывании ГИС, реестров, архивных систем или облачных платформ, где необходимо строгое соблюдение требований ИБ. Его также выбирают финансовые и медицинские организации для хранения клиентских профилей, истории транзакций, электронных медицинских карт и другой конфиденциальной информации.

Еще один распространенный пример — это компании с высоким уровнем зрелости процессов информационной безопасности, имеющие внутренние правила обработки персональных данных и требующие обязательного аудита на соответствие.

«Мы создаем наш продукт, основываясь на глубоком знании локальной среды и особенностей российского бизнеса»

CNews: Какие технические возможности открываются при подключении объектного хранилища к сторонним сервисам? Насколько легко можно увеличить масштабы решения и настроить репликацию при возрастании нагрузки?

Александр Гришин: S3 хранилище Selectel предлагает готовую инфраструктуру, где возможности масштабирования и отказоустойчивости предусмотрены изначально. Клиентам не требуется самостоятельно настраивать кластер, управлять его расширением или репликацией — всё это уже реализовано в рамках полностью управляемого сервиса.

CNews: На какие ключевые отличия от крупных иностранных конкурентов вы ориентируетесь, развивая продукт? Что позволяет Selectel успешно соперничать с глобальными поставщиками в сегменте объектных хранилищ?

Александр Гришин: Наша разработка продукта строится на понимании местной специфики и контекста ведения бизнеса в России. Это дает нам возможность конкурировать с международными игроками — не путем копирования, а за счет предложения более приспособленного, гибкого и экономичного решения, которое при этом полностью соответствует международному стандарту S3 от AWS.

Особого внимания заслуживает наша прозрачная и понятная система тарификации. В ней отсутствуют скрытые платежи и сложные метрики, такие как запросы Class A/B, плата за досрочное удаление или стоимость извлечения данных. Нет никаких штрафов за «раннее удаление» или ограничений по скорости выгрузки. Всё предельно ясно: оплата взимается за хранение, входящий и исходящий трафик, а также за запросы.

Кроме того, все цены зафиксированы в рублях и не подвержены валютным колебаниям или влиянию иностранных юрисдикций — это крайне важно для многих клиентов в условиях импортозамещения и ужесточения регуляторных требований.

CNews: Каким вы видите будущее решений для хранения информации? Какие новые функции или варианты применения появятся в вашем продукте в обозримой перспективе?

Александр Гришин: Вопрос о будущем технологий хранения данных, безусловно, один из самых увлекательных. Я уверен, что перспектива за интеллектуальными, управляемыми и экономически эффективными хранилищами, которые тесно встроены в бизнес-процессы клиентов. Именно в этом направлении мы видим развитие Selectel S3 и уже ведем активную работу.

Рост объемов информации порождает новые сферы применения: искусственный интеллект и машинное обучение, системы видеонаблюдения, интернет вещей, большие данные. Все больше организаций работают с видео, аудио, журналами событий, медицинскими снимками и показаниями датчиков. Благодаря своей масштабируемости и выгодной стоимости хранения, S3 становится центральным элементом для подобных проектов.

Согласно статистике, мировой объем информации увеличивается вдвое каждые два года. Если обратиться к принципу «Иерархии памяти компьютера» (быстродействие, стоимость, емкость), становится очевидно: под влиянием бизнес-потребности в сохранении экспоненциально растущих массивов данных отрасль смещается к основанию этой пирамиды — в сторону более экономичных и вместительных решений. Как раз в этой области располагается S3.

Параллельно набирают силу концепции Data Lake и Lakehouse. Хранилище становится фундаментом для аналитических систем, интегрируясь с такими компонентами, как Trino, Apache Iceberg и Kafka. В наших планах — углубление взаимодействия с платформами данных, что даст возможность прямого доступа к информации через SQL-инструменты без дополнительной пересылки и процедур ETL.

Кроме того, мы внедряем систему интеллектуального управления жизненным циклом данных: автоматическое перераспределение между классами хранения (Hot → Standard → Cold → Ice), которое позволяет переносить информацию на более доступные уровни при снижении частоты ее использования. Недавно был представлен аналог Glacier (класс Ice), а вскоре будет реализована детальная логика управления на уровне отдельных объектов.

Наша компания последовательно укрепляет защиту: внедряются новые механизмы IAM и ролевой модели, совместимые со сторонними системами идентификации через OIDC. Запланирована интеграция с Secrets Manager и Certificate Manager, что позволит хранилищу эффективно взаимодействовать с системами управления ключами и сертификатами.

В направлении надежности мы работаем над расширенной репликацией: автоматическое копирование между регионами и гибкие сценарии аварийного восстановления (DR), например, по цепочке ru-7 → ru-1 → ru-6. Это обеспечит отказоустойчивость без необходимости ручного вмешательства.

Selectel S3 превращается в комплексную платформу для хранения данных, которая воплощает передовой мировой опыт и соответствует спецификациям AWS. Мы фокусируемся на запросах крупных B2B-компаний, для которых критически важны прозрачность, высокая скорость работы, мультирегиональность, безопасность и расширенный набор API-функций. Именно эти аспекты станут основными векторами развития продукта в течение следующих трех лет.

Рекламный материалerid:2W5zFK4TEfJЗаказчик: АО «Селектел»ИНН/ОГРН: ИНН 7810962785 / ОГРН 1247800067790Сайт компании: www.selectel.ru
Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости