[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+5 -5
View File
@@ -1,8 +1,8 @@
---
id: P-REINFORCE-AUTO-QUAN-001
id: [[P-Reinforce]]-AUTO-QUAN-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.96
tags: [auto-reinforced, quantization, deep-learning, performance, hardware-optimization, llm-inference]
tags: [auto-reinforced, quantization, [[Deep-Learning]], performance, [[Hardware]]-[[Optimization]], llm-inference]
last_reinforced: 2026-04-20
---
@@ -18,9 +18,9 @@ last_reinforced: 2026-04-20
* **PTQ (Post-Training Quantization)**: 학습이 끝난 모델을 변환 (빠르고 간편).
* **QAT (Quantization-Aware Training)**: 변환 시 발생할 오차를 학습 과정에서 미리 고려 (고정밀 유지).
2. **이점**:
* **Speed**: 연산 처리량(Throughput) 대폭 향상. (Efficiency와 연결)
* **Energy**: 전력 소모 감소. (Physical-Intelligence와 연결)
* **Memory**: 모델 크기 축소로 저사양 하드웨어 탑재 가능.
* **Speed**: 연산 처리량(Throughput) 대폭 향상. ([[Efficiency]]와 연결)
* **Energy**: 전력 소모 감소. ([[Physical-Intelligence]]와 연결)
* **[[memory]]**: 모델 크기 축소로 저사양 하드웨어 탑재 가능.
3. **왜 중요한가?**:
* AI가 서버실에만 갇혀있지 않고 우리 주머니 속 기기(On-device AI)로 내려오기 위한 필수 관문이기 때문임.