Files
2nd/10_Wiki/Topics_Blog/DevOps-for-AI-MLOps.md
T

31 lines
2.2 KiB
Markdown

---
id: MLOPS-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [ai, mlops, devops, infrastructure, model-lifecycle]
last_reinforced: 2026-04-26
---
# DevOps for AI (MLOps, 에이아이를 위한 데브옵스)
## 📌 한 줄 통찰 (The Karpathy Summary)
> "모델 학습은 시작일 뿐, 지속 가능한 배포와 모니터링의 파이프라인을 구축하라" — 머신러닝 모델의 개발(ML)과 운영(Ops)을 통합하여, 모델의 실험, 학습, 배포, 모니터링 과정을 자동화하고 신뢰성을 확보하는 기술 체계.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** 코드, 데이터, 모델이라는 세 가지 축의 버전을 관리하고, 데이터 변화(Drift)에 대응하여 모델을 자동으로 재학습 및 업데이트하는 지속적 통합/배포(CI/CD/CT) 패턴.
- **핵심 구성 요소:**
- **Data Versioning:** 학습에 사용된 데이터셋의 상태 보존 (DVC 등).
- **Experiment Tracking:** 하이퍼파라미터와 메트릭 기록 (MLflow, WandB).
- **Model Registry:** 검증된 모델의 버전 관리 및 서빙 준비.
- **Continuous Training (CT):** 새로운 데이터 유입 시 파이프라인 자동 실행.
- **Monitoring:** 서빙 중인 모델의 성능 저하 및 데이터 드리프트 감지.
- **의의:** 일회성 실험에 그치던 ML 모델을 실제 비즈니스 가치를 창출하는 안정적인 소프트웨어 서비스로 변환.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 모델의 정확도(Accuracy)에만 집중하던 연구 중심적 사고에서, 모델의 가용성(Availability)과 유지보수 효율을 중시하는 엔지니어링 관점으로 전환.
- **정책 변화:** Antigravity 프로젝트는 에이전트 브레인 업데이트 시 MLOps 파이프라인을 준수하며, 모든 모델 변경 사항은 자동화된 테스트와 벤치마크를 거쳐 배포됨.
## 🔗 지식 연결 (Graph)
- Data-Pipeline-Orchestration, [[Concept-Drift|Concept-Drift]], System-Design-for-AI-Scale, [[Infrastructure-as-Code-IaC|Infrastructure-as-Code-IaC]]
- **Raw Source:** 10_Wiki/Topics/AI/DevOps-for-AI-MLOps.md