2.2 KiB
2.2 KiB
id: MLOps-001 category: Unified confidence_score: 1.0 tags: [ai, mlops, devops, infrastructure, model-lifecycle] last_reinforced: 2026-04-26
DevOps for AI (MLOps, 에이아이를 위한 데브옵스)
📌 한 줄 통찰 (The Karpathy Summary)
"모델 학습은 시작일 뿐, 지속 가능한 배포와 모니터링의 파이프라인을 구축하라" — 머신러닝 모델의 개발(ML)과 운영(Ops)을 통합하여, 모델의 실험, 학습, 배포, 모니터링 과정을 자동화하고 신뢰성을 확보하는 기술 체계.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: 코드, 데이터, 모델이라는 세 가지 축의 버전을 관리하고, 데이터 변화(Drift)에 대응하여 모델을 자동으로 재학습 및 업데이트하는 지속적 통합/배포(CI/CD/CT) 패턴.
- 핵심 구성 요소:
- Data Versioning: 학습에 사용된 데이터셋의 상태 보존 (DVC 등).
- Experiment Tracking: 하이퍼파라미터와 메트릭 기록 (MLflow, WandB).
- Model Registry: 검증된 모델의 버전 관리 및 서빙 준비.
- Continuous Training (CT): 새로운 데이터 유입 시 파이프라인 자동 실행.
- Monitoring: 서빙 중인 모델의 성능 저하 및 데이터 드리프트 감지.
- 의의: 일회성 실험에 그치던 ML 모델을 실제 비즈니스 가치를 창출하는 안정적인 소프트웨어 서비스로 변환.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 단순히 모델의 정확도(Accuracy)에만 집중하던 연구 중심적 사고에서, 모델의 가용성(Availability)과 유지보수 효율을 중시하는 엔지니어링 관점으로 전환.
- 정책 변화: Antigravity 프로젝트는 에이전트 브레인 업데이트 시 MLOps 파이프라인을 준수하며, 모든 모델 변경 사항은 자동화된 테스트와 벤치마크를 거쳐 배포됨.
🔗 지식 연결 (Graph)
- Data-Pipeline-Orchestration, Concept-Drift,_system-Design-for-AI-Scale, Infrastructure-as-Code-IaC
- Raw Source: 10_Wiki/Topics/AI/DevOps-for-AI-MLOps.md