'분류 전체보기' 카테고리의 글 목록 (2 Page)

SLO

DevOps 2025. 5. 20. 10:31

SLO란 무엇인가?SLO(Service Level Objective)는 서비스의 신뢰성에 대한 구체적이고 측정 가능한 목표치를 의미합니다. 이는 서비스 수준 지표(SLI)를 기반으로 하며, 사용자 경험을 중심으로 설정됩니다. 예를 들어, "HTTP 요청의 97%는 성공적으로 처리되어야 한다"와 같은 목표가 SLO에 해당합니다.SLO의 필요성엔지니어링 자원은 한정되어 있으므로, 어떤 작업에 우선순위를 둘지 결정하는 것이 중요합니다. SLO는 이러한 결정을 데이터 기반으로 지원하며, 기능 개발과 신뢰성 확보 간의 균형을 유지하는 데 도움을 줍니다. 또한, SLO를 통해 오류 예산(Error Budget)을 정의하고, 이를 기반으로 릴리스 속도 조절이나 안정성 향상 작업의 필요성을 판단할 수 있습니다.SLO ..

Powerlevel10k로 Zsh 터미널 꾸미기

카테고리 없음 2025. 5. 9. 21:11

Mac에서 기본 쉘로 설정된 Zsh를 더욱 강력하고 아름답게 만들고 싶다면, Powerlevel10k 테마와 함께 Oh My Zsh를 적용해보세요. 이 가이드는 MacBook 사용자를 위한 설치 및 설정 방법을 안내합니다.iTerm2 설치 (권장)Mac 기본 Terminal도 사용 가능하지만, iTerm2는 폰트 설정과 커스터마이징이 쉬워 Powerlevel10k와 궁합이 좋습니다.공식 사이트: https://iterm2.comHomebrew 설치 (필요시)Homebrew는 macOS의 패키지 매니저입니다./bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 설치 후, brew 명령어가 ..

Retrieval-Augmented Generation (RAG)

AI ML 2025. 4. 20. 18:00

RAG는 LLM(예: GPT)이 외부 지식(문서, DB 등)을 검색해서, 그걸 바탕으로 답변을 생성하는 방식이에요. Retrieval-Augmented Generation, 줄여서 RAG는 요즘 AI 기반 Q&A 시스템, 문서 요약, 챗봇 등에 가장 널리 쓰이는 핵심 기술입니다. 왜 필요한가? 일반 LLM (예: GPT, Claude)은 학습된 지식만 알고 있어요.→ 최신 정보나 특정 기업 문서 같은 건 못 알아요. 해결책: RAG외부 지식을 검색 + 요약해서 답변하도록 함 RAG 구조[ 사용자 질문 ] ↓[ 1. 검색기 (Retriever) ] ↓ ← 벡터 DB에서 관련 문서 검색[ 관련 문서 ] ↓[ 2. LLM ] ↓ ..

리눅스 환경에 LangChain 설치

카테고리 없음 2025. 4. 16. 10:17

LangChain (Python) 설치 – 기본 방법1. Python 가상환경 설정 (선택)python3 -m venv .venvsource .venv/bin/activate 2. pip 업그레이드pip install --upgrade pip 3. LangChain 설치pip install langchain 함께 설치하면 좋은 추가 패키지# 임베딩: HuggingFace 모델 사용pip install sentence-transformers# LLM: OpenAI API 사용pip install openai# PDF 추출 (문서 기반 프로젝트라면)pip install pdfplumber# 벡터 DB: Qdrant 클라이언트pip install qdrant-client 설치 후 테스트from langcha..

LLM 생태계 정리

AI ML 2025. 4. 5. 16:42

LLM 생태계는 크게 다음 7가지로 나눌 수 있습니다. 1. 모델 (LLMs)2. 임베딩 (Embeddings)3. 서빙 및 추론 (Inference/Serving)4. 파인튜닝/경량학습 (Fine-tuning/LoRA)5. 검색 기반 강화 (RAG)6. 프레임워크/오케스트레이션7. 에이전트 / 도구 실행 (Agents/Tool Use) 1️⃣ 모델 (LLMs)유형대표 모델상용 APIChatGPT (GPT-3.5/4), Claude 3, Gemini, Mistral API, Cohere오픈소스LLaMA 2/3, Mistral, Mixtral, Falcon, Gemma, Phi, Yi, OpenChat✅ 대부분 Hugging Face에 올라옴 2️⃣ 임베딩 (Embeddings)문장을 벡터로 변환하여 유..

Claude vs ChatGPT

AI ML 2025. 4. 5. 13:34

Claude vs ChatGPT 비교표항목Claude (Anthropic)ChatGPT (OpenAI)🔢 최신 모델Claude 3 (Opus, Sonnet, Haiku)GPT-4 (GPT-4-turbo), GPT-3.5📦 맥락 길이최대 200K tokens (Opus 기준)최대 128K tokens (GPT-4 turbo 기준)📘 학습 철학헌법 AI 기반: 윤리적, 상식 기반 응답RLHF 기반: 사용자 피드백을 반영한 성능🧠 문해력/이해도매우 뛰어남, 긴 문서 요약에 강함고른 전반적 성능, 정제된 표현력🧾 코드 작성기본은 괜찮으나, 생성형 코딩에선 ChatGPT가 더 강함GPT-4가 Copilot과 통합, 실용성이 높음🗂️ 파일 분석문서 정리/요약/문해에 매우 강함 (PDF/Docx)파일 분석..

Large Language Model에서 Transformer 란?

AI ML 2025. 4. 4. 07:37

Transformer는 문장에서 단어들 간의 관계(의미)를 한꺼번에 파악할 수 있게 해주는 딥러닝 모델 구조예요.RNN이나 LSTM처럼 순차적으로 처리하지 않고, 모든 단어를 동시에(병렬로) 처리할 수 있어서 빠르고 정확합니다. Transformer는 Large Language Model(LLM)의 핵심이자, 지금의 ChatGPT나 GPT-4 같은 모델이 존재할 수 있게 해준 기초 기술이에요. Transformer가 등장한 이유기존에는 RNN, LSTM 같은 순환 신경망이 주로 사용됐어요.이들은 단어를 순서대로 처리하면서 문맥을 이해하지만:너무 긴 문장은 앞뒤 연결이 약해짐 (long-term dependency 문제)병렬 처리가 어려움 → 학습 속도 느림그래서 나온 게 바로 "Attention is ..

Platform Engineering 이란

DevOps 2025. 4. 3. 13:10

개발자 생산성과 운영 효율성을 동시에 챙기기 위한 새로운 접근 방식으로 Platform Engineering이 주목받고 있습니다. Platform Engineering이란?Platform Engineering은 개발자들이 소프트웨어를 더 쉽고, 빠르고, 안정적으로 배포할 수 있도록 돕는 내부 개발 플랫폼(Internal Developer Platform, IDP)을 설계하고 운영하는 역할을 말합니다.핵심 개념은 이거예요:“개발자가 인프라나 배포 과정을 몰라도, 셀프서비스로 빠르게 개발에 집중할 수 있는 환경을 제공하자.”주요 특징:자동화된 셀프서비스 도구 제공→ 개발자가 버튼 하나로 배포하고, 로그 보고, 테스트 환경 만드는 식내부 플랫폼 팀 운영→ 인프라, CI/CD, 보안, 모니터링 등을 하나로 묶어..

ABOUT ME

DevOps Colleague

티스토리툴바