DevOps
-
Real User Monitoring(RUM) 개념DevOps 2025. 3. 15. 20:23
Real User Monitoring(RUM)은 실제 사용자의 웹 애플리케이션 사용 경험을 실시간으로 모니터링하는 기법입니다. 웹사이트 또는 애플리케이션에서 사용자의 실제 활동을 분석하여 성능 문제를 파악하고 개선하는 데 활용됩니다. RUM은 브라우저에서 직접 데이터를 수집하며, 다음과 같은 정보를 포함할 수 있습니다.페이지 로드 시간 (Time to First Byte, First Contentful Paint, Largest Contentful Paint 등)사용자 행동 분석 (클릭, 스크롤, 네비게이션 패턴)네트워크 성능 (DNS 조회 시간, 서버 응답 시간, 리소스 로드 시간)지리적 위치 기반 성능 차이 (지역별 네트워크 속도 분석)사용자 디바이스 및 브라우저 정보 (모바일 vs. 데스크톱, Ch..
-
RTO, RPO와 TTD, TTE, TTF의 관계DevOps 2025. 3. 15. 11:43
RTO (Recovery Time Objective)와 RPO (Recovery Point Objective)는 TTD (Time to Detect), TTE (Time to Engage), TTF (Time to Fix)와 밀접한 관련이 있어. 이 개념들은 모두 시스템 장애 발생 시 복구 속도와 데이터 손실을 최소화하는 목표와 연결되어 있어. 1️⃣ 용어 정의용어의미질문RTO (복구 시간 목표)장애 발생 후 서비스가 복구되는 최대 허용 시간"시스템을 얼마나 빨리 복구해야 할까?"RPO (복구 지점 목표)장애 발생 시 허용 가능한 최대 데이터 손실 시간"얼마나 최근의 데이터를 복구할 수 있어야 할까?"TTD (탐지 시간)장애를 감지하는 데 걸리는 시간"장애를 얼마나 빨리 발견할 수 있을까?"TTE (대응..
-
RTO, RPO 개념DevOps 2025. 3. 15. 11:25
RTO (Recovery Time Objective)와 RPO (Recovery Point Objective)는재해 복구(Disaster Recovery) 및 비즈니스 연속성(BCP, Business Continuity Planning)에서 중요한 두 가지 목표 지표 1️⃣ RTO (Recovery Time Objective, 복구 시간 목표)시스템 장애 발생 후 서비스가 복구될 때까지 걸리는 최대 허용 시간✅ 질문: "서비스가 다운되면 얼마나 빨리 복구해야 하는가?"✅ 예제:RTO = 5분 → 장애 발생 후 5분 이내에 서비스를 복구해야 함.RTO = 1시간 → 1시간 이내에 정상 운영 가능해야 함.💡 비즈니스 영향:RTO가 짧을수록 (예: 1~5분) 빠른 복구 솔루션(예: 자동 장애 감지 및 페일오..
-
staggered rollout 개념DevOps 2025. 3. 15. 10:21
점진적이고 단계적인 배포 방식을 총칭하는 개념 Staggered Rollout이란?Netflix, AWS 등에서는 Staggered Rollout을 사용하여 대규모 시스템에서 변경 사항을 안전하게 배포합니다. 기본 개념은 한 번에 전체 시스템을 변경하는 것이 아니라, 여러 단계로 나누어 배포를 진행하는 것입니다.이를 통해 실시간으로 배포 상태를 모니터링하고, 문제가 발생하면 빠르게 롤백하거나 영향을 최소화할 수 있습니다. Staggered Rollout vs. Blue/Green, Canary 배포배포 방식개념Netflix의 Staggered Rollout과의 관계Blue/Green두 개의 환경(Blue/Green) 중 하나를 운영하며, 배포 시 전체 트래픽을 새로운 환경(Green)으로 전환Netfli..