Аварийное восстановление и резервное копирование для PostgreSQL/Platform V Pangolin SE
Whitepaper 'FinOps and cost management for Kubernetes'

Построение надёжного аварийного восстановления в Microsoft Azure

Что такое аварийное восстановление?

Современные предприятия сейчас более уязвимы для ИТ-сбоев, чем когда-либо прежде, из-за их сильной зависимости от ИТ-инфраструктуры. Всякий раз, когда данные теряются, программное обеспечение не отвечает или аппаратное или сетевое оборудование выходит из строя, компания теряет большую сумму денег. Но есть решение, позволяющее минимизировать влияние или даже предотвратить его — аварийное восстановление.

Аварийное восстановление — это набор инструментов и политик, которые помогают восстановить критически важные данные, приложения и оборудование, чтобы обеспечить непрерывность бизнеса после внезапного инцидента в сфере ИТ.

Надежная стратегия аварийного восстановления должна основываться на стратегии аварийного восстановления, неотъемлемой частью которой является план, имеющий четко определенные значения RTO и RPO. Прежде чем мы двинемся дальше, давайте подробнее остановимся на этих терминах.

Функции аварийного восстановления, за которыми нужно следить

План аварийного восстановления (Disaster Recovery Plan) представляет собой задокументированную и согласованную последовательность шагов, которые следует предпринять при возникновении ИТ-сбоя. Целевое время восстановления (Recovery Time Objective – RTO) относится к максимальному количеству времени, которое может пройти после инцидента, прежде чем определенное приложение или служба снова заработают. Например, если в компании используется приложение для распознавания лиц, и для этого приложения целевое время восстановления составляет десять минут, оно должно снова начать работать и быть доступным в сети в течение десяти минут после сбоя. Целевая точка восстановления (Recovery Point Objective – RPO) технически также характеризуется количеством времени, но на самом деле это относится к объему данных, которые компания может позволить себе потерять между резервными копиями. RPO в 24 часа означает, что в случае ИТ-сбоя копия данных, которая будет восстановлена, будет не старше 24 часов. Другими словами, цель точки восстановления определяет, как часто создается и резервируется моментальный снимок системы.  

Recognized by Forrester as a leading cloud cost management solution

аварийное восстановление и бэкап для MS Azure

Аварийное восстановление в Microsoft Azure

Компании стремятся восстанавливаться после ИТ-сбоев как можно быстрее и с минимальными потерями, поэтому неудивительно, что они предпочитают выбирать надежные услуги от известного поставщика. Вот почему Azure Site Recovery, которая представляет собой «аварийное восстановление как услугу» от Microsoft, является беспроблемным выбором для большинства предприятий. В результате компания Gartner впервые назвала ASR лидером отрасли еще в 2016 году и с тех пор не теряет своих лидирующих позиций.

Обзор службы Microsoft Azure Site Recovery

Azure Site Recovery — хороший выбор для компаний, в которых критически важные рабочие нагрузки выполняются в основном на VMware или Hyper-V. DRaaS от Microsoft тесно интегрирован с Microsoft Endpoint Configuration Manager (ранее System Center Configuration Manager), программным продуктом, разработанным для управления большими массивами компьютеров под управлением Windows NT, Windows Embedded, macOS, Linux или UNIX, а также различных мобильных операционных систем, которые делает ASR удобным для компаний, которые придерживаются стека Microsoft.

Плюсы и минусы Microsoft Azure Site Recovery

Azure Site Recovery позволяет физическим локальным, виртуальным машинам Azure, Hyper-V и виртуальным машинам VMware запускать копии защищенных машин в целевом резервном облаке в случае аварии и выполнять синхронизацию изменений с исходной площадкой после ее устранения.

Изначально решение Microsoft для аварийного восстановления было ориентировано на системы хранения данных, а затем расширилось до аварийного восстановления как услуги; так что теперь он может похвастаться почти постоянным процессом репликации данных, что позволяет синхронизировать копии.

ASR также известен своей экономичностью — несмотря на то, что он оснащен набором функций резервного копирования, аварийного восстановления и создания отчетов, он будет стоить меньше, чем большинство его отраслевых конкурентов. В некотором смысле Azure Site Recovery — это недорогая альтернатива более традиционным подходам, при которых единственные необходимые расходы связаны с хранением для поддержки моментальных снимков приложений, сохранением точек восстановления и ежемесячной платой за обслуживание.

ASR можно интегрировать с такими решениями для обеспечения непрерывности бизнеса и аварийного восстановления, как Oracle Data Guard и SQL Always On. С точки зрения рабочей нагрузки и защиты приложений Site Recovery легко интегрируется с многочисленными рабочими нагрузками, включая DNS, Exchange, Active Directory, SAP и т. д.

Как мы уже говорили, целевое значение точки восстановления (RPO) и целевое время восстановления (RTO) являются важнейшими свойствами любого решения для аварийного восстановления, и именно в этом ASR хорош — для большинства виртуальных машин порог RPO не превышает 30 секунд, а для некоторых из них репликация непрерывна. Что касается RTO, компания должна использовать диспетчер трафика Azure, балансировщик нагрузки трафика на основе DNS, который распределяет трафик по регионам Azure, чтобы резко сократить его, тем самым облегчив возможный процесс восстановления.

С другой стороны, есть некоторые недостатки, которые следует серьезно учитывать, прежде чем принимать решение о том, следует ли предпочесть Azure Site Recovery другим решениям для аварийного восстановления.

Прежде всего, решение аварийного восстановления Azure требует высокого уровня знаний, что делает невозможным его использование без штатного или внештатного ИТ-специалиста во всех сценариях аварийного восстановления, кроме самых простых.

Еще одним серьезным недостатком Azure Site Recovery является отсутствие автоматизации. Например, переход на другой ресурс — это полностью ручной процесс, который может оказаться дорогостоящим без должного внимания и знаний.

Еще один недостаток, который нельзя упускать из виду, заключается в том, что ASR требует дополнительного программного обеспечения для полной работоспособности и набора функций. Таким образом, как уже отмечалось, для поддержания низкого RTO следует использовать Azure Traffic Manager. Или, если в компании используются конфигурации с несколькими ВМ, дополнительно потребуется System Center Virtual Machine Manager.

Как настроить аварийное восстановление в Microsoft Azure

Прежде чем переходить к настройке аварийного восстановления, компании должны убедиться, что они разработали надежную стратегию аварийного восстановления для реализации. В большинстве случаев он должен решать следующие вопросы:
  • Бюджет
  • Ресурсы
  • Используемая технология
  • Защита данных
  • Поставщики
  • Риски и страховое покрытие
  • Требования соответствия

Когда у них есть стратегия, они могут начать ее реализовывать.

Microsoft предлагает четыре основных сценария аварийного восстановления в Azure:

  • Аварийное восстановление виртуальной машины Azure в Azure
  • Аварийное восстановление ВМ VMware в Azure
  • Аварийное восстановление виртуальной машины Hyper-V в Azure
  • Аварийное восстановление решения Azure VMware в Azure

В зависимости от выбранного сценария будет применяться соответствующий план действий, но в большинстве случаев он будет включать следующие шаги:

  1. Подготовка ресурсов и компонентов MS Azure для настройки аварийного восстановления облачных ВМ, локальных ВМ или физических серверов в MS Azure
  2. Подготовка облачных ВМ, локальных ВМ или физических серверов к аварийному восстановлению в MS Azure
  3. Включение репликации для облачных виртуальных машин, локальных виртуальных машин или физических серверов
  4. Выполнение тестовых запусков по аварийному восстановлению с временным переходом на другой ресурс
  5. Отказоустойчивые облачные ВМ, локальные ВМ или физические серверы в MS Azure
  6. Отказ от виртуальных машин MS Azure
  7. Включение репликации в MS Azure


Чтобы узнать больше о конкретных сценариях и соответствующих планах действий, обратитесь к разделу документации Microsoft Azure.

Free cloud cost optimization for a lifetime

Заключение

Давайте подведем итоги. Поскольку ИТ-сбои представляют собой угрозу для предприятий, которые полагаются на ИТ-инфраструктуру, аварийное восстановление становится критически важным в современном мире. Чтобы убедиться, что это действительно стоит ваших усилий, просто подсчитайте, сколько ваша компания может потерять в случае нескольких часов простоя, и сравните это со стоимостью внедрения аварийного восстановления. Microsoft Azure — это решение с богатым функционалом и гибкостью настройки, доступное по низкой цене, что делает его одним из лучших предложений для обеспечения отказоустойчивости инфраструктуры.

Однако, чтобы увидеть полную картину, следует помнить, что для настройки аварийного восстановления в MS Azure требуются глубокие знания. Есть и другие недостатки, такие как отсутствие автоматизации или зависимость от дополнительного программного обеспечения, которые следует тщательно рассмотреть, прежде чем принимать окончательное решение о выборе решения для аварийного восстановления.

👆🏻 Узнайте больше о ключевых характеристиках программного решения Хайстекс Акура по облачной миграции, backup и аварийному восстановлению  

Будьте в курсе наших новостей и обновлений продукта 

Спасибо, что подписались на нашу рассылку!

Нажимая на кнопку “Подписаться”, вы даёте своё согласие на обработку персональных данных и получение информации о продуктах посредством рассылок 

Узнать больше о Хайстекс Акура

DR/бэкап и миграция для Сбербанка с помощью Хайстекс Акура

Как Хайстекс мигрирует критически важные для бизнеса рабочие нагрузки Сбербанка в одну платформу виртуализации для распределения нагрузки и возможности скалирования ресурсов

Программное решение Хайстекс Акура

Узнайте больше о главных преимуществах продукта Хайстекс Акура, ключевыx этапах процесса миграции, возможностях DR (аварийного восстановления) и cloud backup-решений 

DR/бэкап и миграция в Яндекс.Облако с помощью Хайстекс Акура

Как Хайстекс помог Яндекс.Облако повысить безопасность и надежность ИТ-инфраструктуры и улучшить стратегию миграции рабочих нагрузок клиентов