Следует ли мне создавать стратегию аварийного восстановления в публичных облаках, поскольку они, как правило, устойчивы, или просто использовать резервное копирование? Если да, то какая для меня лучшая стратегия аварийного восстановления? Давайте это обсудим…
В чем отличие аварийного восстановления от резервного копирования данных?
Прежде всего, давайте кратко обсудим разницу между аварийным восстановлением и резервным копированием, поскольку большинство не видят разницы или даже используют термины неправильно. Резервное копирование – это когда вы дублируете состояние ваших данных на каком-то носителе (ленте, сетевом хранилище NAS, облачном хранилище и т. д.), а затем имеете возможность восстановить отсутствующий элемент или элементы из точек восстановления. В соответствии с некоторыми настройками и политиками хранения, это защищает от потери данных, программ-вымогателей или системных сбоев. Лучшее решение для резервного копирования – это то, которое эффективно хранит данные и предоставляет различные варианты восстановления, такие как выборочное восстановление файлов/папок, восстановление в базу данных и т. д. Обычно предполагается, что восстановление выполняется в той же или похожей среде.
Тем временем, Disaster Recovery (аварийное восстановление) обеспечивает быструю репликацию и восстановление приложений и всей инфраструктуры; потребление ресурсов хранилища важно, но основное внимание уделяется низкому RPO (целевое время восстановления – время между репликациями) и RTO (целевое время восстановления – время для восстановления всей системы после аварии). Данные хранятся в готовом к использованию формате, выборочное восстановление файлов/папок является преимуществом, но не основным аспектом. Идеальное решение для аварийного восстановления должно иметь возможность восстановления в другом облаке или регионе и обладать функциональностью плавного failback (возврат приложений после устранения сбоя).
Какую технологию следует использовать - резервное копирование или аварийное восстановление?
Зная разницу между данными технологиями, теперь не сложно понять, что Вам, по крайней мере, необходима функциональность резервного копирования. Это лучше, чем ничего, и к тому же поможет восстановиться после сбоя или катастрофы. Вы можете использовать стандартные возможности публичного облака для создания моментальных снимков дисков или обратиться за помощью к поставщику услуг. Просто убедитесь, что вы понимаете, сколько времени занимает восстановление и где хранятся данные, сколько нужно заплатить за резервную копию (не только за лицензии, если она не бесплатная, но и за хранение/передачу данных) и как восстановить данные или виртуальные машины.
Резервное копирование удобно, когда Вам нужно восстановить какую-то часть Вашей информации, но не очень помогает, когда весь центр обработки данных или зона доступности не работают.
Еще несколько лет назад компании считали публичные облака чем-то небезопасным и нестабильным. Сейчас наблюдается обратная тенденция – люди склонны думать, что публичные облака чрезвычайно надежны, хранят все данные в нескольких копиях и обеспечивают до 100% безотказной работы. В некоторых случаях это так, но истина где-то посередине.
Даже в публичных облаках время от времени возникают проблемы – отдельные регионы или какие-то службы могут быть недоступны, что влияет на их клиентов, включая вас, как их клиента. Если в облаке есть проблема из-за подключения, то и у ваших приложений и виртуальных машин будут проблемы. Вы можете сказать, что это случается редко, что беспокоиться не стоит. Но в современное время, когда вводятся новые санкции, против компаний и бизнеса в РФ, когда есть проблемы с поставками нового оборудования, проблема может образоваться моментально. В целом, оценивая ситуацию, если вас устраивает простой до 6 часов (это среднее время за которое публичное облако восстановит работу своих служб), то ладно.
А если же нет, то вам нужно рассчитать две вещи:
- Сколько стоит час простоя.
- Как долго вы будете восстанавливать всю свою инфраструктуру из резервной копии.
Это поможет не только защититься от облачного сбоя, но и быть готовым к программам-вымогателям, человеческим ошибкам (около 70% всех сбоев происходит из-за этого) или любому аппаратному сбою.
Если вычисление по этим двум пунктам дает результаты, которые вас не устраивают, вам нужно использовать DR-решение.
Критерии выбора решения по аварийному восстановлению
На рынке доступно несколько решений аварийного восстановления. Мы предлагаем вам помнить о следующих критериях:
- Если это возможно, используйте другое общедоступное облако для перехода в режим восстановления после сбоя. Это предотвратит воздействие на вас глобальной ошибки и даст вам настоящую мобильность рабочих нагрузок. Это означает, что вы не привязаны к конкретному облаку и можете использовать лучшее из всех них.
- Выполняйте регулярные тесты аварийного восстановления. Жаль, что компании не используют стратегию аварийного восстановления, и еще больше разочаровывает то, что люди платят за то, что не работает. Проводите тест хотя бы раз в месяц.
- Найдите баланс между собственными облачными сервисами и запуском приложений самостоятельно. Облачные сервисы удобны и просты в использовании, но не существует простого способа их аварийного переключения.
- Проведите сравнительный анализ нескольких программ для восстановления после катастрофы – некоторые компании по резервному копированию осознают путаницу между резервным копированием и восстановлением после сбоя и утверждают, что они могут запускать полный переход в режим восстановления всей инфраструктуры. Проверьте и убедитесь, что вы удовлетворены результатами.
Публичные облака идеально подходят для использования в качестве отказоустойчивой площадки: вам не нужно строить отдельную аварийную площадку с аппаратными, программными лицензиями и поддерживать ее, учитывая, что 80% времени она будет простаивать, готовясь к отказоустойчивости. В противном случае общедоступные облака можно использовать для хранения моментальных снимков, и вам не нужно платить за вычислительные ресурсы, пока вы не запустите восстановление после сбоя.
В заключение
Имейте в виду, что, по крайней мере, решение для резервного копирования в настоящее время является обязательным. Подумайте, насколько критично для вашего бизнеса быть отключенным до тех пор, пока вы не восстановитесь из резервной копии, и подумайте о решении аварийного восстановления. Публичные облака – лучший вариант для использования в качестве резервной площадки. Следует помнить, что есть два типа компаний: а), которые еще не делают резервные копии, и б) которые уже ее создали.
Более подробно о необходимости резервного копирования или аварийного восстановления вы можете узнать →
👆🏻 Узнайте больше о ключевых характеристиках программного решения Хайстекс Акура по аварийному восстановлению, бэкапу данных и облачной миграции →