ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • RTO, RPO 개념
    DevOps 2025. 3. 15. 11:25
    728x90

    RTO (Recovery Time Objective)RPO (Recovery Point Objective)

    재해 복구(Disaster Recovery) 및 비즈니스 연속성(BCP, Business Continuity Planning)에서 중요한 두 가지 목표 지표

     

    1️⃣ RTO (Recovery Time Objective, 복구 시간 목표)

    시스템 장애 발생 후 서비스가 복구될 때까지 걸리는 최대 허용 시간

    질문: "서비스가 다운되면 얼마나 빨리 복구해야 하는가?"
    예제:

    • RTO = 5분 → 장애 발생 후 5분 이내에 서비스를 복구해야 함.
    • RTO = 1시간 → 1시간 이내에 정상 운영 가능해야 함.

    💡 비즈니스 영향:

    • RTO가 짧을수록 (예: 1~5분) 빠른 복구 솔루션(예: 자동 장애 감지 및 페일오버) 이 필요.
    • RTO가 길어도 되는 서비스(예: 백업 시스템)는 비용을 절약할 수 있음.

     

    2️⃣ RPO (Recovery Point Objective, 복구 지점 목표)

    데이터 손실을 허용할 수 있는 최대 시간(복구 시점 기준 데이터 손실 허용 범위)

    질문: "장애 발생 시, 얼마만큼의 데이터를 잃어도 되는가?"
    예제:

    • RPO = 10분 → 마지막 백업이 10분 전이라면 10분치 데이터 손실은 허용 가능.
    • RPO = 1시간 → 마지막 백업이 1시간 전이라면 1시간치 데이터 손실 허용 가능.
    • RPO = 0초(Zero RPO) → 실시간 동기화 필요(예: DB Master-Slave Replication).

    💡 비즈니스 영향:

    • RPO가 짧을수록(예: 0초~1분) 데이터 복구 전략이 중요 (예: 실시간 복제, 지속적 백업).
    • 긴 RPO(예: 24시간)라면 하루치 데이터 손실을 감수할 수 있지만 비용이 낮아짐.

    🔹 RTO vs RPO 정리

    구분RTO (복구 시간 목표)RPO (복구 지점 목표)
    의미 장애 발생 후 복구까지 걸리는 최대 시간 허용 가능한 데이터 손실량
    질문 "얼마나 빨리 복구해야 하나?" "얼마나 오래된 데이터까지 복구 가능해야 하나?"
    예제 5분, 1시간, 24시간 0초(실시간), 10분, 1시간, 1일
    관련 기술 장애 감지, 자동 복구, 페일오버 백업, 데이터 복제, 스냅샷
    비즈니스 중요도 서비스 다운타임과 연관 데이터 손실과 연관

     

    🔹 RTO & RPO 적용 예시

    1️⃣ 금융 서비스 (은행, 결제 시스템)

    • RTO = 1~5분 (다운타임 최소화 필수)
    • RPO = 0초 (실시간 복제 필요, 데이터 유실 불가)

    2️⃣ 이커머스 (쇼핑몰, 결제 서비스)

    • RTO = 10분~1시간 (일부 지연 가능)
    • RPO = 10~30분 (최근 주문 데이터는 반드시 보호)

    3️⃣ SNS 서비스 (페이스북, 트위터)

    • RTO = 1시간~몇 시간 (일부 다운타임 가능)
    • RPO = 1시간~24시간 (일부 게시글 데이터 유실 허용 가능)

    4️⃣ 사내 문서 시스템 (비즈니스 문서 저장소)

    • RTO = 24시간 이내 (급하지 않은 서비스)
    • RPO = 24시간 (하루치 데이터 유실 가능)

     

    🔹 RTO & RPO와 관련된 복구 전략

    복구 전략 RTO RPO 기술 예시
    Active-Active (실시간 복제) 거의 0 (즉시) 거의 0 (실시간) Multi-Region DB, Master-Master Replication
    Active-Passive (핫 스탠바이) 몇 분~1시간 0~1시간 DB Replication, 페일오버
    Warm Standby (따뜻한 대기, 예비 시스템 운영) 몇 시간 몇 시간 스냅샷 복구, 리스토어
    Cold Backup (콜드 백업, 주기적 백업만 수행) 하루 이상 하루 이상 정기적 백업(S3, Glacier)

    💡 즉, RTO & RPO가 짧을수록 더 빠르고 강력한 복구 솔루션이 필요하며, 비용이 증가함.

     

     

    🎯 결론

    • RTO(Recovery Time Objective) = "얼마나 빨리 복구해야 하나?" → 다운타임 최소화 목표
    • RPO(Recovery Point Objective) = "얼마나 최근 데이터를 복구해야 하나?" → 데이터 손실 최소화 목표
    • RTO와 RPO가 낮을수록 고가용성(HA) 솔루션이 필요하며 비용이 증가.
    • 비즈니스 중요도에 따라 RTO/RPO 목표를 설정하고 적절한 복구 전략을 선택해야 함.

    🚀 즉, 시스템 장애에 대비한 RTO/RPO를 잘 정의하면 비즈니스 연속성을 효과적으로 보장할 수 있어!

    728x90
Designed by Tistory.