Аварийное восстановление и резервное копирование для PostgreSQL/Platform V Pangolin SE
Whitepaper 'FinOps and cost management for Kubernetes'

Анализ понятий RPO и RTO в стратегиях аварийного восстановления и резервного копирования

Recognized by Forrester as a leading cloud cost management solution

Free cloud cost optimization for a lifetime

Понимание различий между RTO и RPO

Целевая или конечная точка восстановления (RPO) и целевое или конечное время восстановления (RTO) – это основные аспекты, определяющие стратегию защиты и аварийного восстановления данных. Эти параметры являются ключевыми при выборе оптимального плана резервного копирования и аварийного восстановления данных в облачной инфраструктуре.

Показатели RPO и RTO в сочетании с анализом их влияния на бизнес играют ведущую роль в разработке комплексного плана обеспечения непрерывности бизнес-процессов:

  • RPO и RTO – ключевые компоненты, которые способствуют выявлению, анализу и разработке эффективных тактик для включения в план обеспечения непрерывности бизнеса.
  • RPO и RTO помогают в выборе стратегий, которые позволяют возобновить бизнес-процессы в сроки, соответствующие или приближенные к заданным целевым значениям RPO и RTO.

На первый взгляд, эти два термина могут показаться достаточно похожими. Чтобы различать RPO и RTO, следует понимать «RP» в «RPO» как обозначение «Rewrite Parameters» (переписать параметры) и «RT» в «RTO» как указание на «Real-Time» (реальное время).

Понятие RTO в аварийном восстановлении

Целевое или конечное время восстановления (RTO) представляет собой максимально допустимое время, в течение которого бизнес-процесс может находиться в автономном режиме после сбоя, прежде чем проявятся его негативные последствия. По сути, RTO отвечает на вопрос: «Сколько времени может потребоваться для восстановления операций после сбоя?».

Применительно к аварийному восстановлению и защите данных RTO определяет максимально допустимый промежуток времени «в реальном времени», прежде чем прерывание отрицательным образом скажется на нормальном функционировании бизнес-процессов.

RPO в облачной защите данных

В сфере облачной безопасности данных, ключевую роль играет понятие RPO или конечная точка восстановления. Концепция RPO заключается в определении четких временных рамок, пока уровень потери данных не достигнет заранее установленного порога допустимости, предусмотренного в плане по обеспечению непрерывности процесса.

Анализ показателей RPO помогает определить, на какой интервал времени организация может безопасно вернуться в прошлое, учитывая возможные потери данных за этот период. Представьте ситуацию, в которой RPO установлен на уровне 20 часов, при сбое системы последние неизмененные данные были получены 18 часов назад. В таком случае организация возвращается во времени до целевой точки и продолжает свою деятельность в рамках установленных параметров RPO своего плана обеспечения непрерывности бизнеса.

Значения RPO каждой организации зависят от множества факторов, и они могут отличаться для различных сфер применения. Вот несколько основных факторов, которые могут оказать влияние на RPO:

 

  • Отраслевые особенности. Организациям, работающим с конфиденциальными данными, такими как финансовые операции или медицинские записи, часто требуется более частое обновление, чтобы свести к минимуму риск потери данных.

 

  • Вариативность хранения данных. Выбор способа хранения данных, будь то физические файлы или облачные решения, может существенно повлиять на скорость и эффективность процессов восстановления данных.

 

  • Финансовые последствия потери данных. Осознание экономических последствий потери данных и сбоев в работе играет ключевую роль при определении точки восстановления (Recovery Point Objective, RPO).

 

  • Максимально допустимая потеря данных. Каждая организация должна определить свой максимально приемлемый уровень потери данных, который может меняться в зависимости от индивидуальных требований и приоритетов.

 

  • Инвестиции в решения по аварийному восстановлению. Финансовые затраты на развитие аварийных решений могут повлиять на скорость и эффективность восстановления данных в случае чрезвычайных ситуаций.

 

  • Соответствие установленным требованиям. Некоторые нормативные документы включают положения, касающиеся аварийного восстановления, защиты и доступности данных, и они могут оказывать влияние на целевые показатели RPO компании.

Важно отметить, что часто возникает расхождение между фактическими результатами (фактическое время восстановления – RTA и фактическая точка восстановления – RPA) и целями, поставленными организацией. Эти отличия могут быть выявлены только во время тестирований аварийного восстановления или во время сбоев в процессе работы, что позволяет организациям отладить свои стратегии защиты данных и повысить эффективность восстановления после аварийных ситуаций.

Варианты подходов к резервному копированию, как части стратегии аварийного восстановления компаний

Постоянная репликация данных

Это метод копирования данных, который характеризуется своей высокой надежностью и четким соответствием цели восстановления (Recovery Point Objective, RPO).

  • Гарантия RPO. Непрерывная репликация обеспечивает надежную цель восстановления (Recovery Point Objective, RPO). RPO определяет максимально допустимую потерю данных после сбоя.
 
  • Обеспечение точных копий. При этом методе целевая система непрерывно поддерживает точную копию исходных данных. Такой тщательный процесс репликации минимизирует потерю данных и гарантирует их согласованность.
 
  • Скорость изменений. Конкретные значения RPO зависят от скорости синхронизации изменений между исходной и целевой системами. Чем быстрее происходит синхронизация, тем меньше показатели RPO.
 
  • Синхронная и асинхронная репликация. Синхронная или асинхронная репликация играет важную роль в определении значений RPO.Синхронная репликация обеспечивает практически мгновенную согласованность данных, в то время как асинхронная репликация может иметь небольшую задержку в передаче данных.
 
  • Своевременное предоставление данных. В итоге, достижение целевого RPO зависит от своевременной доступности данных на целевом или реплицируемом сайте для приложения. Это подчеркивает значимость оперативного доступа к данным в сценариях использования аварийного восстановления.

Традиционные методы бэкапа

Сценарий основан на традиционных методах резервного копирования, предполагающих периодическое резервное копирование по расписанию в определенное время.

  • Запланированное время. Резервное копирование планируется дважды в день – например, в 6:00 утра и 6:00 вечера. Это время отражает заранее заданную частоту резервного копирования.
 
  • Первичное нарушение работы. Рассматривается ситуация внезапного отказа или сбоя в работе, вызванного различными факторами, такими как проблемы с оборудованием, стихийные бедствия или системные ошибки.
 
  • Возможность восстановления данных. В случае первичного нарушения работы в 14:00 единственными доступными для восстановления данными будут утренние резервные копии в 6:00. Это подчеркивает критическую важность регулярного резервного копирования для минимизации потери данных.
 
  • Цель точки восстановления (RPO). В данном случае RPO составляет 8 часов. Это означает, что при самом неблагоприятном исходе возможна потеря данных за 8 часов из-за разрыва во времени между последним резервным копированием (6:00 утра) и сбоем (14:00). Это максимально допустимая потеря данных.
 
  • Цель по времени восстановления (RTO): RTO составляет 2 часа. Это означает, что процесс восстановления и возвращения системы в рабочее состояние после сбоя должен быть завершен в течение двух часов. Это подчеркивает важность эффективных процессов восстановления.

В заключение

Подводя итог, следует отметить, что цели, связанные с точкой восстановления (RPO) и временем восстановления (RTO), являются ключевыми элементами в стратегиях аварийного восстановления и защиты данных.

Для выбора соответствующего плана резервного копирования и аварийного восстановления в облаке эти показатели имеют важное значение, поскольку они обеспечивают устойчивость ИТ-системы и непрерывность бизнес-процессов.

Для некритических систем могут быть допустимы более высокие значения RPO и RTO, в то время как для критически важных систем обычно стремятся к их минимизации. Управление RPO и RTO представляет собой баланс между стоимостью, доступностью и риском для организации.

С помощью решения Хайстекс Акура вы сможете добиться оптимальных показателей RPO и RTO даже в сценариях межгипервизорного DR. Наш продукт позволяет реплицировать данные и важные рабочие нагрузки в соответствии с нормативными требованиями, сохраняя полный контроль над отказоустойчивостью и инфраструктурой резервного копирования.

👆🏻 С помощью программного продукта Хайстекс Акура Вы можете эффективно и безопасно реализовать резервное копирование или аварийное восстановление для любой платформы виртуализации, без даунтайма и потери данных. Свяжитесь с нами → 

Будьте в курсе наших новостей и обновлений продукта 

Спасибо, что подписались на нашу рассылку!

Нажимая на кнопку “Подписаться”, вы даёте своё согласие на обработку персональных данных и получение информации о продуктах посредством рассылок 

Узнать больше о Хайстекс Акура

DR/бэкап и миграция для Сбербанка с помощью Хайстекс Акура

Как Хайстекс мигрирует критически важные для бизнеса рабочие нагрузки Сбербанка в одну платформу виртуализации для распределения нагрузки и возможности скалирования ресурсов

Программное решение Хайстекс Акура

Узнайте больше о главных преимуществах продукта Хайстекс Акура, ключевыx этапах процесса миграции, возможностях DR (аварийного восстановления) и cloud backup-решений 

DR/бэкап и миграция в Яндекс.Облако с помощью Хайстекс Акура

Как Хайстекс помог Яндекс.Облако повысить безопасность и надежность ИТ-инфраструктуры и улучшить стратегию миграции рабочих нагрузок клиентов