전체 글
-
Toil 줄이기 전략DevOps 2025. 5. 20. 12:23
Toil 줄이기 전략 5가지전략설명1. 관측 가능성 향상 (Observability First)알람, 로그, 지표, 분산 추적 등을 먼저 체계화해 장애 원인 분석을 쉽게 만듦2. 작업 표준화 → 자동화반복 작업을 문서화하고, 스크립트나 워크플로로 전환3. 셀프 서비스화티켓 기반 수동 작업을 개발자/운영자가 직접 처리할 수 있는 포털이나 CLI 제공4. GitOps 도입인프라/설정 변경을 코드 기반으로 관리하여 수동 운영 제거5. Toil 계량 및 주간 점검각 작업 시간을 기록하고, 일정 비율 이상 Toil일 경우 리팩터링 계획 수립 실무 자동화 사례1. 서비스 배포 자동화BeforeAfterJenkins에서 수동 빌드 + 수동 승인 후 배포Git push → CI/CD 파이프라인 → 배포 자동 진행운영자..
-
SRE 컨택스트에서 Toil의 정의DevOps 2025. 5. 20. 12:20
Toil은 반복적이고 수동적이며, 자동화되지 않았고, 사용자 가치에 직접적으로 기여하지 않으며, 시스템이 성장할수록 증가하는 작업입니다.— Google SRE Book 정의 Toil의 대표적인 예시유형예시수동 운영서버 재시작, 로그 수집, 알람 확인 후 수작업 대응반복 작업매일/매주 수동 배포, 모니터링 구성 갱신기계적 대응장애 대응 시 매번 문서 보며 동일한 조치 수행티켓 처리수동 계정 생성 요청, DNS 레코드 수정 요청 등 Toil의 조건 (Google SRE 기준)Toil은 다음 조건 중 여러 개를 만족해야 합니다:조건설명수동적사람의 개입이 필요함반복적같은 작업을 자주 반복함자동화 가능기술적으로 자동화가 가능함비가치 창출고객에게 직접적인 가치를 주지 않음확장성 없음시스템 규모가 커질수록 업무량..
-
SLODevOps 2025. 5. 20. 10:31
SLO란 무엇인가?SLO(Service Level Objective)는 서비스의 신뢰성에 대한 구체적이고 측정 가능한 목표치를 의미합니다. 이는 서비스 수준 지표(SLI)를 기반으로 하며, 사용자 경험을 중심으로 설정됩니다. 예를 들어, "HTTP 요청의 97%는 성공적으로 처리되어야 한다"와 같은 목표가 SLO에 해당합니다.SLO의 필요성엔지니어링 자원은 한정되어 있으므로, 어떤 작업에 우선순위를 둘지 결정하는 것이 중요합니다. SLO는 이러한 결정을 데이터 기반으로 지원하며, 기능 개발과 신뢰성 확보 간의 균형을 유지하는 데 도움을 줍니다. 또한, SLO를 통해 오류 예산(Error Budget)을 정의하고, 이를 기반으로 릴리스 속도 조절이나 안정성 향상 작업의 필요성을 판단할 수 있습니다.SLO ..
-
Powerlevel10k로 Zsh 터미널 꾸미기카테고리 없음 2025. 5. 9. 21:11
Mac에서 기본 쉘로 설정된 Zsh를 더욱 강력하고 아름답게 만들고 싶다면, Powerlevel10k 테마와 함께 Oh My Zsh를 적용해보세요. 이 가이드는 MacBook 사용자를 위한 설치 및 설정 방법을 안내합니다.iTerm2 설치 (권장)Mac 기본 Terminal도 사용 가능하지만, iTerm2는 폰트 설정과 커스터마이징이 쉬워 Powerlevel10k와 궁합이 좋습니다.공식 사이트: https://iterm2.comHomebrew 설치 (필요시)Homebrew는 macOS의 패키지 매니저입니다./bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 설치 후, brew 명령어가 ..
-
Retrieval-Augmented Generation (RAG)AI ML 2025. 4. 20. 18:00
RAG는 LLM(예: GPT)이 외부 지식(문서, DB 등)을 검색해서, 그걸 바탕으로 답변을 생성하는 방식이에요. Retrieval-Augmented Generation, 줄여서 RAG는 요즘 AI 기반 Q&A 시스템, 문서 요약, 챗봇 등에 가장 널리 쓰이는 핵심 기술입니다. 왜 필요한가? 일반 LLM (예: GPT, Claude)은 학습된 지식만 알고 있어요.→ 최신 정보나 특정 기업 문서 같은 건 못 알아요. 해결책: RAG외부 지식을 검색 + 요약해서 답변하도록 함 RAG 구조[ 사용자 질문 ] ↓[ 1. 검색기 (Retriever) ] ↓ ← 벡터 DB에서 관련 문서 검색[ 관련 문서 ] ↓[ 2. LLM ] ↓ ..
-
리눅스 환경에 LangChain 설치카테고리 없음 2025. 4. 16. 10:17
LangChain (Python) 설치 – 기본 방법1. Python 가상환경 설정 (선택)python3 -m venv .venvsource .venv/bin/activate 2. pip 업그레이드pip install --upgrade pip 3. LangChain 설치pip install langchain 함께 설치하면 좋은 추가 패키지# 임베딩: HuggingFace 모델 사용pip install sentence-transformers# LLM: OpenAI API 사용pip install openai# PDF 추출 (문서 기반 프로젝트라면)pip install pdfplumber# 벡터 DB: Qdrant 클라이언트pip install qdrant-client 설치 후 테스트from langcha..
-
LLM 생태계 정리AI ML 2025. 4. 5. 16:42
LLM 생태계는 크게 다음 7가지로 나눌 수 있습니다. 1. 모델 (LLMs)2. 임베딩 (Embeddings)3. 서빙 및 추론 (Inference/Serving)4. 파인튜닝/경량학습 (Fine-tuning/LoRA)5. 검색 기반 강화 (RAG)6. 프레임워크/오케스트레이션7. 에이전트 / 도구 실행 (Agents/Tool Use) 1️⃣ 모델 (LLMs)유형대표 모델상용 APIChatGPT (GPT-3.5/4), Claude 3, Gemini, Mistral API, Cohere오픈소스LLaMA 2/3, Mistral, Mixtral, Falcon, Gemma, Phi, Yi, OpenChat✅ 대부분 Hugging Face에 올라옴 2️⃣ 임베딩 (Embeddings)문장을 벡터로 변환하여 유..
-
Claude vs ChatGPTAI ML 2025. 4. 5. 13:34
Claude vs ChatGPT 비교표항목Claude (Anthropic)ChatGPT (OpenAI)🔢 최신 모델Claude 3 (Opus, Sonnet, Haiku)GPT-4 (GPT-4-turbo), GPT-3.5📦 맥락 길이최대 200K tokens (Opus 기준)최대 128K tokens (GPT-4 turbo 기준)📘 학습 철학헌법 AI 기반: 윤리적, 상식 기반 응답RLHF 기반: 사용자 피드백을 반영한 성능🧠 문해력/이해도매우 뛰어남, 긴 문서 요약에 강함고른 전반적 성능, 정제된 표현력🧾 코드 작성기본은 괜찮으나, 생성형 코딩에선 ChatGPT가 더 강함GPT-4가 Copilot과 통합, 실용성이 높음🗂️ 파일 분석문서 정리/요약/문해에 매우 강함 (PDF/Docx)파일 분석..