[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-ADAPTIVE-COMPUTE
|
||||
id: [[P-Reinforce]]-AI-ADAPTIVE-COMPUTE
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.97
|
||||
tags: [AI, Efficiency, AdaptiveCompute, Inference]
|
||||
tags: [AI, [[Efficiency]], AdaptiveCompute, Inference]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
@@ -14,7 +14,7 @@ last_reinforced: 2026-04-20
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **Early Exit**: 모델의 중간 층에서 이미 결과가 확실하다면 최종 층까지 가지 않고 바로 결과를 출력하여 시간과 에너지를 아낌.
|
||||
- **MoE (Mixture of Experts)**: 거대 모델의 일부(전공 교수)만 활성화하여 특정 분야의 질문에만 자원을 집중함.
|
||||
- **Dynamic Token Processing**: 문맥상 중요하지 않은 단어(조사 등)는 낮은 정밀도로 처리하고, 핵심적인 단어에 연산력을 몰아줌.
|
||||
- **Dynamic Token [[Processing]]**: 문맥상 중요하지 않은 단어(조사 등)는 낮은 정밀도로 처리하고, 핵심적인 단어에 연산력을 몰아줌.
|
||||
- **Inference Efficiency**: 동일한 정확도를 유지하면서 서빙 비용(GPU 소모)을 획기적으로 낮추는 핵심 열쇠다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
|
||||
Reference in New Issue
Block a user