Понимание различий между RTO и RPO
Целевая или конечная точка восстановления (RPO) и целевое или конечное время восстановления (RTO) – это основные аспекты, определяющие стратегию защиты и аварийного восстановления данных. Эти параметры являются ключевыми при выборе оптимального плана резервного копирования и аварийного восстановления данных в облачной инфраструктуре.
Показатели RPO и RTO в сочетании с анализом их влияния на бизнес играют ведущую роль в разработке комплексного плана обеспечения непрерывности бизнес-процессов:
- RPO и RTO – ключевые компоненты, которые способствуют выявлению, анализу и разработке эффективных тактик для включения в план обеспечения непрерывности бизнеса.
- RPO и RTO помогают в выборе стратегий, которые позволяют возобновить бизнес-процессы в сроки, соответствующие или приближенные к заданным целевым значениям RPO и RTO.
На первый взгляд, эти два термина могут показаться достаточно похожими. Чтобы различать RPO и RTO, следует понимать «RP» в «RPO» как обозначение «Rewrite Parameters» (переписать параметры) и «RT» в «RTO» как указание на «Real-Time» (реальное время).
Понятие RTO в аварийном восстановлении
Целевое или конечное время восстановления (RTO) представляет собой максимально допустимое время, в течение которого бизнес-процесс может находиться в автономном режиме после сбоя, прежде чем проявятся его негативные последствия. По сути, RTO отвечает на вопрос: «Сколько времени может потребоваться для восстановления операций после сбоя?».
Применительно к аварийному восстановлению и защите данных RTO определяет максимально допустимый промежуток времени «в реальном времени», прежде чем прерывание отрицательным образом скажется на нормальном функционировании бизнес-процессов.
RPO в облачной защите данных
В сфере облачной безопасности данных, ключевую роль играет понятие RPO или конечная точка восстановления. Концепция RPO заключается в определении четких временных рамок, пока уровень потери данных не достигнет заранее установленного порога допустимости, предусмотренного в плане по обеспечению непрерывности процесса.
Анализ показателей RPO помогает определить, на какой интервал времени организация может безопасно вернуться в прошлое, учитывая возможные потери данных за этот период. Представьте ситуацию, в которой RPO установлен на уровне 20 часов, при сбое системы последние неизмененные данные были получены 18 часов назад. В таком случае организация возвращается во времени до целевой точки и продолжает свою деятельность в рамках установленных параметров RPO своего плана обеспечения непрерывности бизнеса.
Значения RPO каждой организации зависят от множества факторов, и они могут отличаться для различных сфер применения. Вот несколько основных факторов, которые могут оказать влияние на RPO:
- Отраслевые особенности. Организациям, работающим с конфиденциальными данными, такими как финансовые операции или медицинские записи, часто требуется более частое обновление, чтобы свести к минимуму риск потери данных.
- Вариативность хранения данных. Выбор способа хранения данных, будь то физические файлы или облачные решения, может существенно повлиять на скорость и эффективность процессов восстановления данных.
- Финансовые последствия потери данных. Осознание экономических последствий потери данных и сбоев в работе играет ключевую роль при определении точки восстановления (Recovery Point Objective, RPO).
- Максимально допустимая потеря данных. Каждая организация должна определить свой максимально приемлемый уровень потери данных, который может меняться в зависимости от индивидуальных требований и приоритетов.
- Инвестиции в решения по аварийному восстановлению. Финансовые затраты на развитие аварийных решений могут повлиять на скорость и эффективность восстановления данных в случае чрезвычайных ситуаций.
- Соответствие установленным требованиям. Некоторые нормативные документы включают положения, касающиеся аварийного восстановления, защиты и доступности данных, и они могут оказывать влияние на целевые показатели RPO компании.
Важно отметить, что часто возникает расхождение между фактическими результатами (фактическое время восстановления – RTA и фактическая точка восстановления – RPA) и целями, поставленными организацией. Эти отличия могут быть выявлены только во время тестирований аварийного восстановления или во время сбоев в процессе работы, что позволяет организациям отладить свои стратегии защиты данных и повысить эффективность восстановления после аварийных ситуаций.
Варианты подходов к резервному копированию, как части стратегии аварийного восстановления компаний
Постоянная репликация данных
- Гарантия RPO. Непрерывная репликация обеспечивает надежную цель восстановления (Recovery Point Objective, RPO). RPO определяет максимально допустимую потерю данных после сбоя.
- Обеспечение точных копий. При этом методе целевая система непрерывно поддерживает точную копию исходных данных. Такой тщательный процесс репликации минимизирует потерю данных и гарантирует их согласованность.
- Скорость изменений. Конкретные значения RPO зависят от скорости синхронизации изменений между исходной и целевой системами. Чем быстрее происходит синхронизация, тем меньше показатели RPO.
- Синхронная и асинхронная репликация. Синхронная или асинхронная репликация играет важную роль в определении значений RPO.Синхронная репликация обеспечивает практически мгновенную согласованность данных, в то время как асинхронная репликация может иметь небольшую задержку в передаче данных.
- Своевременное предоставление данных. В итоге, достижение целевого RPO зависит от своевременной доступности данных на целевом или реплицируемом сайте для приложения. Это подчеркивает значимость оперативного доступа к данным в сценариях использования аварийного восстановления.
Традиционные методы бэкапа
- Запланированное время. Резервное копирование планируется дважды в день – например, в 6:00 утра и 6:00 вечера. Это время отражает заранее заданную частоту резервного копирования.
- Первичное нарушение работы. Рассматривается ситуация внезапного отказа или сбоя в работе, вызванного различными факторами, такими как проблемы с оборудованием, стихийные бедствия или системные ошибки.
- Возможность восстановления данных. В случае первичного нарушения работы в 14:00 единственными доступными для восстановления данными будут утренние резервные копии в 6:00. Это подчеркивает критическую важность регулярного резервного копирования для минимизации потери данных.
- Цель точки восстановления (RPO). В данном случае RPO составляет 8 часов. Это означает, что при самом неблагоприятном исходе возможна потеря данных за 8 часов из-за разрыва во времени между последним резервным копированием (6:00 утра) и сбоем (14:00). Это максимально допустимая потеря данных.
- Цель по времени восстановления (RTO): RTO составляет 2 часа. Это означает, что процесс восстановления и возвращения системы в рабочее состояние после сбоя должен быть завершен в течение двух часов. Это подчеркивает важность эффективных процессов восстановления.
В заключение
Подводя итог, следует отметить, что цели, связанные с точкой восстановления (RPO) и временем восстановления (RTO), являются ключевыми элементами в стратегиях аварийного восстановления и защиты данных.
Для выбора соответствующего плана резервного копирования и аварийного восстановления в облаке эти показатели имеют важное значение, поскольку они обеспечивают устойчивость ИТ-системы и непрерывность бизнес-процессов.
Для некритических систем могут быть допустимы более высокие значения RPO и RTO, в то время как для критически важных систем обычно стремятся к их минимизации. Управление RPO и RTO представляет собой баланс между стоимостью, доступностью и риском для организации.
С помощью решения Хайстекс Акура вы сможете добиться оптимальных показателей RPO и RTO даже в сценариях межгипервизорного DR. Наш продукт позволяет реплицировать данные и важные рабочие нагрузки в соответствии с нормативными требованиями, сохраняя полный контроль над отказоустойчивостью и инфраструктурой резервного копирования.
С помощью программного продукта Хайстекс Акура Вы можете эффективно и безопасно реализовать резервное копирование или аварийное восстановление для любой платформы виртуализации, без даунтайма и потери данных. Свяжитесь с нами →