Interview

SLI, SLO, SLA의 차이점은?

DevOps Engineer 2025. 3. 11. 20:20
728x90

SLI, SLO, SLA의 차이점

개념설명예제

SLI (Service Level Indicator) 서비스의 신뢰성을 측정하는 실제 메트릭(지표) "응답 시간이 200ms 이하인 요청 비율"
SLO (Service Level Objective) 내부적으로 설정한 목표 (Threshold) "응답 시간이 200ms 이하인 요청을 99.9% 유지"
SLA (Service Level Agreement) 고객과 계약한 서비스 보장 수준 (이를 어기면 페널티) "99.9% 가용성 미달 시 크레딧 보상"

 

 

1. Service Level Indicator (SLI) – 서비스 품질을 측정하는 지표

SLI는 시스템의 성능과 가용성을 측정하는 객관적인 메트릭으로, SLI를 통해 시스템의 실제 상태를 수치화할 수 있습니다.

📌 SLI 예시

  • Latency (지연 시간): 응답 시간이 200ms 이하인 요청의 비율
  • Availability (가용성): 정상적으로 처리된 요청 수 / 총 요청 수
  • Error Rate (에러율): HTTP 500 에러 응답 수 / 전체 요청 수
  • Throughput (처리량): 초당 처리 가능한 요청 수
  • Durability (데이터 안정성): 손실 없이 저장된 데이터 비율

➡️ SLI는 현재 서비스 상태를 측정하는 실시간 데이터 기반 지표


2. Service Level Objective (SLO) – 내부 목표 값

SLO는 내부적으로 설정하는 서비스 목표 기준(Threshold) 으로,
이 목표를 초과하면 신뢰성이 낮아졌다고 판단하고, 이를 개선하기 위한 조치를 취해야 합니다.

📌 SLO 예시

  • "서비스의 응답 시간 200ms 이하 비율을 99.9% 이상 유지"
  • "99.95% 가용성을 유지"
  • "에러율을 0.01% 미만으로 유지"

➡️ SLO는 SLA보다 엄격한 목표로 설정하는 것이 일반적이며, Error Budget과 연결되어 서비스 배포 속도를 조절하는 기준이 됨.


🔹 3. Service Level Agreement (SLA) – 고객과 맺는 계약

SLA는 서비스 제공자가 고객과 약속하는 서비스 품질 보장 수준으로
만약 SLA를 충족하지 못하면, 서비스 제공자는 페널티(예: 크레딧 보상)를 제공해야 합니다.

📌 SLA 예시

  • "99.9% 이상의 가용성을 보장하며, 이를 충족하지 못할 경우 서비스 크레딧을 제공한다."
  • "데이터 저장의 안정성을 99.9999999% (9-nines) 보장한다."
  • "응답 시간이 500ms를 초과하면 고객에게 10% 요금 할인 제공."

➡️ SLA는 법적 효력이 있는 계약 조건이므로, SLO보다 낮게 설정하는 것이 일반적임


🔹 SLI, SLO, SLA의 관계

이해하기 쉽게 비유하자면:

1️⃣ SLI현재 상태를 측정하는 센서
2️⃣ SLO내부 목표 (SLA보다 엄격하게 설정)
3️⃣ SLA고객과의 약속 (미달 시 페널티)

🚗 자동차 예시로 보면:

  • SLI: "현재 속도가 100km/h" (측정값)
  • SLO: "제한 속도를 120km/h 이하로 유지" (목표값)
  • SLA: "130km/h 이상으로 달리면 벌금을 부과" (계약 및 페널티)
728x90