32 lines
2.3 KiB
Markdown
32 lines
2.3 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-DIST-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.96
|
|
tags: [auto-reinforced, distillation, model-distillation, knowledge-transfer, efficiency, edge-ai]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Distillation|Distillation]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "거인의 지혜를 작은 그릇에 담기: 거대하고 무거운 AI 모델(Teacher)이 가진 복잡한 연산 결과를 가볍고 빠른 소형 모델(Student)이 모방하게 학습시켜, 성능은 유지하면서 운영 비용과 속도를 극적으로 최성화하는 지식 전수의 미학."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
지식 증류(Distillation, Knowledge Distillation)는 큰 모델의 능력을 작은 모델로 옮기는 모델 압축 기법입니다.
|
|
|
|
1. **방법론**:
|
|
* **Soft Targets**: 단순한 정답(0 또는 1)이 아니라, 스승 모델이 내놓은 확률 값(예: "개 70%, 고양이 30%")을 제자 모델이 배우게 함. 정보의 풍부함이 유지됨.
|
|
* **Loss Function**: 제자 모델의 예측과 스승 모델의 예측 사이의 오차를 최소화하도록 최적화.
|
|
2. **왜 중요한가?**:
|
|
* **On-device AI**: 스마트폰이나 임베디드 기기에서 돌아가는 가벼운 AI 필수 기술.
|
|
* **Cost Reduction**: 서버 비용을 1/100로 줄임과 동시에 응답 속도 향상.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 무조건 '더 큰 모델 정책'만이 정답이었으나, 현대 정책은 큰 모델로 데이터를 생성하고 작은 모델을 학습시키는 '증류 기반 최적화 정책'이 비즈니스 관점에서 더 합리적임을 입증함(RL Update). (Data Distillation과 대비)
|
|
- **정책 변화(RL Update)**: 최근에는 제자 모델이 스승 모델보다 특정 영역에서 더 뛰어난 성능을 보이는 '역전 현상 정책'이나, 여러 스승으로부터 배우는 '다중 증류 정책' 등으로 고도화됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Data Distillation (데이터 증류)|Data Distillation (데이터 증류)]], [[Optimization|Optimization]], [[Efficiency|Efficiency]], [[Edge-Computing|Edge-Computing]], [[Technical-Architecture|Technical-Architecture]]
|
|
- **Modern Tech/Tools**: DistilBERT, MobileNet, TinyLlama, Ollama (Model management).
|
|
---
|