Утром в четверг, 7 мая, около 08:45 по местному времени, в центре обработки данных NorthC AMS3, расположенном в Алмере неподалёку от Амстердама (Нидерланды), вспыхнул пожар. К настоящему моменту возгорание удалось локализовать. Как сообщили в компании NorthC, очаг возгорания находился в тыльной части строения, где размещены технические помещения. На протяжении дня пламя не удавалось потушить, несмотря на задействование трёх пожарных машин. В результате инцидента пострадали как местные государственные, так и частные предприятия, а также облачная платформа IBM Cloud Amsterdam 03.
Ситуация с возгоранием, которому изначально был присвоен уровень угрозы GRIP 2, к вечеру была взята под контроль: уровень опасности понизили до GRIP 1, а оповещение NL-Alert отменили. «Это свидетельствует о том, что огонь находится под контролем», — отметили представители NorthC на своём сайте. 8 мая в 0:35 по местному времени компания уточнила, что пожарная служба снизила уровень угрозы до GRIP 0. Это указывает на то, что аварийные службы полностью управляют обстановкой, и здание частично снова открыто. В 10:00 в NorthC заявили, что ночью провели оценку состояния сооружения после пожара, подчеркнув, что противопожарная изоляция не дала огню и дыму распространиться дальше по зданию.
Источник изображения: NorthC
«Наши команды в полном составе работают на месте, занимаясь восстановлением подачи электроэнергии и связи. В рамках этих мероприятий подготавливаются внешние аварийные источники питания, чтобы как можно быстрее и безопаснее включить оборудование клиентов», — проинформировала компания.
По данным ресурса The Next Web, пожар привёл к перебоям в функционировании информационных систем Утрехтского университета, чьи серверы находятся в ЦОД NorthC. Сбои также затронули работу общественного транспорта провинции Утрехт, так как в дата-центре размещены серверы компании Transdev, управляющей автобусными и трамвайными маршрутами в этом регионе. Кроме того, с трудностями столкнулись фирма Infomedics, занимающаяся обработкой счетов от имени медицинских учреждений, и местное управление водоснабжения Hoogheemraadschap De Stichtse Rijnlanden.
Помимо этого, проблемы затронули и облачный сегмент IBM Cloud, причём внутренние системы мониторинга IBM долгое время ошибочно сообщали, что всё функционирует нормально. Компания дала комментарий изданию The Register: «IBM в курсе инцидента с возгоранием в дата-центре, расположенном в Амстердаме, который обслуживает как IBM, так и сторонние организации. Персонал эвакуирован, никто не пострадал. Мы активно взаимодействуем с аварийными службами, проводим оценку влияния на нашу деятельность и напрямую связываемся с затронутыми клиентами, чтобы минимизировать последствия».
Источник изображения: IBM Cloud
По данным на 14:48 по московскому времени IBM (INC11282490) полностью обесточила дата-центр, все сервисы и каналы связи неработоспособны. Специалисты компании уже осмотрели ЦОД и сейчас анализируют сложившуюся обстановку, в то время как NorthC предпринимает усилия по восстановлению подачи электричества. IBM советует клиентам переходить на другие облачные площадки и активировать собственные планы аварийного восстановления. В пострадавшем регионе недоступны ключевые вычислительные мощности, средства связи и хранения данных, в том числе IBM Cloud Backup. Годом ранее IBM Cloud также пережила как минимум один серьёзный инцидент, когда пользователи лишились доступа к своим ресурсам.
Осмотр, проведённый экспертами IBM в 17:11 по московскому времени, показал, что все три серверных зала в ЦОД не пострадали и не имеют следов воздействия дыма или воды. Основная трудность по-прежнему связана с отключением электроэнергии в серверном помещении №1, так как соседнее здание с инженерными системами и охлаждением, обеспечивающее его работу, вышло из строя. При этом здания инженерных коммуникаций и системы охлаждения, обслуживающие помещения №2 и №3, визуально остались неповреждёнными.
Главной целью для возобновления работы сервисов является восстановление доступа пользователей к ресурсам в помещениях №2 и №3. Одновременно с этим компания намерена перенести оборудование и вычислительные нагрузки из серверного зала №1 в зал №3, что займёт несколько суток. На данный момент ЦОД остаётся недоступным. Все системы связи и сервисы отключены. «Мы настоятельно рекомендуем клиентам по возможности переключиться на резервный ЦОД», — заявили в IBM.
В минувшем году в Южной Корее произошло крупное возгорание в центре обработки данных, что привело к в работе множества государственных сервисов и 858 терабайт правительственной информации. В текущем году небольшой пожар в лондонском дата-центре Global Switch. В марте из-за физического нападения центр обработки данных AWS в Объединённых Арабских Эмиратах, что фактически облачный регион.
Источники: