[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-QUAN-001
|
||||
id: [[P-Reinforce]]-AUTO-QUAN-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.96
|
||||
tags: [auto-reinforced, quantization, deep-learning, performance, hardware-optimization, llm-inference]
|
||||
tags: [auto-reinforced, quantization, [[Deep-Learning]], performance, [[Hardware]]-[[Optimization]], llm-inference]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
@@ -18,9 +18,9 @@ last_reinforced: 2026-04-20
|
||||
* **PTQ (Post-Training Quantization)**: 학습이 끝난 모델을 변환 (빠르고 간편).
|
||||
* **QAT (Quantization-Aware Training)**: 변환 시 발생할 오차를 학습 과정에서 미리 고려 (고정밀 유지).
|
||||
2. **이점**:
|
||||
* **Speed**: 연산 처리량(Throughput) 대폭 향상. (Efficiency와 연결)
|
||||
* **Energy**: 전력 소모 감소. (Physical-Intelligence와 연결)
|
||||
* **Memory**: 모델 크기 축소로 저사양 하드웨어 탑재 가능.
|
||||
* **Speed**: 연산 처리량(Throughput) 대폭 향상. ([[Efficiency]]와 연결)
|
||||
* **Energy**: 전력 소모 감소. ([[Physical-Intelligence]]와 연결)
|
||||
* **[[memory]]**: 모델 크기 축소로 저사양 하드웨어 탑재 가능.
|
||||
3. **왜 중요한가?**:
|
||||
* AI가 서버실에만 갇혀있지 않고 우리 주머니 속 기기(On-device AI)로 내려오기 위한 필수 관문이기 때문임.
|
||||
|
||||
|
||||
Reference in New Issue
Block a user