ENG

Перейти в Дзен
Мнение, Технологии

Аварийное восстановление бизнеса при пандемии

Аркадий Рапопорт

Аркадий Рапопорт

Менеджер продуктов дата-центров Tet (ex-Lattelecom) компании Tet

Больше года мир живет в условиях тотальных ограничений, вызванных пандемией COVID-19. Нет отрасли, которая не ощутила бы на себе влияния вируса, а одним из самых главных пострадавших ожидаемо признан бизнес. Для выживания на ранних этапах, когда уровень неопределенности был на максимальном уровне, компаниям требовалось в кратчайшие сроки сменить офлайн-формат работы на онлайн. ИТ-инфраструктура стала залогом нормального функционирования в новых условиях — владельцы бизнеса на себе проверили, как даже небольшой сбой онлайн-сервисов может отразиться на деятельности всего предприятия. Справиться с угрозой остановки бизнес-процессов можно. О том, как это грамотно сделать, расскажет Аркадий Рапопорт, менеджер продуктов дата-центров Tet (ex-Lattelecom).

Бизнес VS пандемия
Аварийное восстановление как ключ к выживанию
Существующие инструменты аварийного восстановления


Бизнес VS пандемия 

Частичный, а зачастую и полный перевод деятельности в онлайн стал вынужденной мерой для огромного числа предприятий. Требования социального дистанцирования почти одномоментно оказали такие нагрузки на ИТ-инфраструктуру, с которыми далеко не все компании могли справиться. Многократно возросшее количество инцидентов, связанных с «падениями» сервисов, которые в условиях жесткой конкуренции в онлайн-среде приводили к потере клиентов, заставили руководителей бизнеса по-новому взглянуть на подходы к обеспечению своей деятельности.

Особую роль в новых условиях сыграло планирование бюджетов. Опыт показал, что в большинстве случаев бизнес оказался не готовым к любым, даже мелким, сбоям в ИТ-системах и неожиданно и резко возрастающим нагрузкам на инфраструктуру компании. В результате руководство тратит средства не на снижение рисков, а на решение уже существующих проблем, что стоит в несколько раз больше и, что еще важнее, не выполняет основную задачу — не обеспечивает непрерывность ключевых процессов в компании.

Несмотря на то, что большинство руководителей и ИТ-специалистов были знакомы с принципами планирования непрерывности бизнеса (Business Continuity Planning) еще задолго до наступления кризиса, оказалось, на практике мало кто представляет, как нужно действовать на самом деле. Опрос аналитиков Gartner показал, что только 12% предприятий заявили о готовности к кризису во время пандемии. Закрытие всех офисов, экстренный перевод сотрудников на «удаленку» и увеличившаяся в разы нагрузка на IT-системы стали огромным стрессом для компаний — бизнес был попросту не готов к сложностям такого масштаба. Мы отмечаем, что коронавирус обнаружил и «надавил» на слабые места предприятий во всем мире.

Аварийное восстановление как ключ к выживанию

Сбои, которые до перехода в онлайн вызывали лишь незначительные, терпимые для бизнеса издержки, в новой реальности становятся причиной, по которой компании могут «приостановить» деятельность навсегда. Усугубляет положение то, что в период возросших на инфраструктуру нагрузок риск нарушения в функционировании онлайн-сервисов компании значительно повышается. Единственная возможность снизить риски и обеспечить отказоустойчивость ключевых бизнес-процессов — разработка плана аварийного восстановления (Disaster Recovery Plan, DR-план). Грамотно составленный и детально продуманный DR-план может спасти бизнес практически в любой ситуации. В нем прописаны алгоритмы действий в большинстве случаев, вызванных неполадками внутренней инфраструктуры:

  • отказы оборудования;
  • нарушения в работе программного обеспечения;
  • повреждение или потеря данных;
  • внешние угрозы кибербезопасности;
  • человеческий фактор.

Разработка плана аварийного восстановления требует от руководства бизнеса глубокого анализа целей компании, а также их приоритетности. Требуется определить, какие сервисы критичны для каждого конкретного бизнес-процесса — одним словом, определить, в какой последовательности их нужно «поднимать» в случае сбоя. Этот анализ называется Business Impact Analysis, и только после него можно подбирать непосредственно инструменты аварийного восстановления.

Вынужденная миграция бизнеса в онлайн показала: комфортно себя чувствовали только те компании, которые заранее подготовили все необходимое и имели на руках проработанный DR-план. Хотя в докоронавирусное время руководство компаний нередко пренебрегало планом аварийного восстановления, опасаясь «лишних», по их мнению, расходов, в новых условиях ситуация кардинально изменилась: DR-планы получили широкое распространение среди игроков любой отрасли.

Определяющее значение в росте популярности «планов по спасению бизнеса» имеют облачные технологии. Только благодаря облакам руководители смогли оптимизировать ресурсы и сократить время, необходимое на разработку DR-решений. Наши аналитики говорят о повышении роли облачных технологий в жизни бизнеса — по нашим подсчетам, на сектор облачных услуг приходится 24% от всех бюджетных расходов на IT. При этом в 2019 году показатель равнялся 21%.

Существующие инструменты аварийного восстановления

Резервное копирование или «бэкап» (backup) — создание копии файлов и папок на дополнительном носителе информации (внешнем жестком диске, CD/DVD-диске, флэшке, в облачном хранилище и т.д. ). Оно необходимо для восстановления данных, которые повредились или разрушились в основном месте их хранения.

Очень важно, чтобы решения, выбранные компанией для бэкапа, отвечали ее потребностям и позволяли создавать автоматизированные планы резервного копирования. Благодаря тому, что процесс резервирования проходит зачастую не реже одного раза в сутки (обычно ночью), утраченные данные можно восстановить в любой момент, даже если пропажу заметили не сразу.

Однако для максимальной сохранности информации и реальной непрерывности функционирования ключевых бизнес-процессов одного бэкапа будет недостаточно. Виной этому недостатки, которые есть у инструмента. Например, создание резервных копий и «откат» к ним занимает определенное время, что тормозит возврат к нормальной работе сервисов в случае сбоя. В зависимости от объема информации это может занять часы, что уже не подходит бизнесу в новых условиях, или даже дни. Также следует помнить, что бэкап не дает компании дополнительную площадку, на которой можно было бы продолжить работу, пока основная инфраструктура подвергается настройке, ремонту или восстановлению. Более того, может оказаться, что самая ранняя копия (сделанная вчера ночью, например) не будет консистентной. Для бизнеса это означает потерю данных и трату большого количества времени на восстановление из предыдущей версии.

Измерить эффективность системы бэкапа можно с помощью специальных показателей — RPO и RTO. Первый (recovery point objective) говорит о времени, в течение которого действует актуальность резервных данных. Второй (recovery time objective) показывает, в какой срок можно будет восстановить потерянную информацию. Для каждого бизнеса показатели индивидуальны, поскольку настраиваются, исходя из целей и задач компании.

Обеспечить нормальную работу бизнеса и сохранность всех данных можно благодаря использованию резервного копирования в тандеме с системами аварийного восстановления (Disaster Recovery). Такой подход поможет восстановить функционирование операционной системы и программного обеспечения после сбоя оборудования или потери данных. Аварийное восстановление помогает «поднять» ИТ-инфраструктуру в максимально сжатые сроки. Достигается это за счет запуска серверов компании в другом месте (онлайн). Решение способно работать даже в самых трудных условиях, например при показателях RPO и RTO равняются нулю и нескольким минутам соответственно. Таким образом, аварийное восстановление — реальный способ спасти бизнес от длительного простоя, что в наших условиях фактически означает потерю огромной прибыли. Однако и тут есть подводные камни — Disaster Recovery не гарантирует защищенности данных.

Модель Disaster Recovery as a Service, или DRaaS (аварийное восстановление как сервис), подразумевает наличие «запасного аэродрома» — резервной площадки, где развернута инфраструктура компании, полностью идентичная основной. Такую площадку могут создать внутренние специалисты, или задача может быть отдана на аутсорс облачному провайдеру.

COVID-19 буквально «указал» компаниям на необходимость целенаправленной работы по поддержанию непрерывности бизнеса. Однако недостаточно применить лишь один инструмент — спасти компанию, ее ключевые бизнес-процессы в кризисной ситуации сможет только комплексный подход. Инвестиции в его разработку окупятся стабильной работой, а значит, и удовлетворенными клиентами.

Следите за нашими новостями в удобном формате
Перейти в Дзен

Предыдущая статьяСледующая статья