toil
-
Toil 줄이기 전략DevOps 2025. 5. 20. 12:23
Toil 줄이기 전략 5가지전략설명1. 관측 가능성 향상 (Observability First)알람, 로그, 지표, 분산 추적 등을 먼저 체계화해 장애 원인 분석을 쉽게 만듦2. 작업 표준화 → 자동화반복 작업을 문서화하고, 스크립트나 워크플로로 전환3. 셀프 서비스화티켓 기반 수동 작업을 개발자/운영자가 직접 처리할 수 있는 포털이나 CLI 제공4. GitOps 도입인프라/설정 변경을 코드 기반으로 관리하여 수동 운영 제거5. Toil 계량 및 주간 점검각 작업 시간을 기록하고, 일정 비율 이상 Toil일 경우 리팩터링 계획 수립 실무 자동화 사례1. 서비스 배포 자동화BeforeAfterJenkins에서 수동 빌드 + 수동 승인 후 배포Git push → CI/CD 파이프라인 → 배포 자동 진행운영자..
-
SRE 컨택스트에서 Toil의 정의DevOps 2025. 5. 20. 12:20
Toil은 반복적이고 수동적이며, 자동화되지 않았고, 사용자 가치에 직접적으로 기여하지 않으며, 시스템이 성장할수록 증가하는 작업입니다.— Google SRE Book 정의 Toil의 대표적인 예시유형예시수동 운영서버 재시작, 로그 수집, 알람 확인 후 수작업 대응반복 작업매일/매주 수동 배포, 모니터링 구성 갱신기계적 대응장애 대응 시 매번 문서 보며 동일한 조치 수행티켓 처리수동 계정 생성 요청, DNS 레코드 수정 요청 등 Toil의 조건 (Google SRE 기준)Toil은 다음 조건 중 여러 개를 만족해야 합니다:조건설명수동적사람의 개입이 필요함반복적같은 작업을 자주 반복함자동화 가능기술적으로 자동화가 가능함비가치 창출고객에게 직접적인 가치를 주지 않음확장성 없음시스템 규모가 커질수록 업무량..