docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, quantization, deep-learning, performance, hardware-optim
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Quantization]]
|
||||
# [[Quantization|Quantization]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "디지털 다이어트의 예술: 32비트 고정밀 실수로 저장된 거대 AI 모델의 가중치를 4비트나 8비트 정수로 압축하여, 성능은 거의 유지하면서 용량과 연산 속도를 1/10 수준으로 혁명적으로 줄여 스마트폰에서도 AI가 돌아가게 만드는 마법."
|
||||
@@ -29,6 +29,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: 단순히 비트를 줄이는 정책을 넘어, 중요한 레이어는 유지하고 덜 중요한 레이어만 양자화하는 '혼합 정밀도 양자화 정책'이 표준 정책이 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Efficiency]], [[Physical-Intelligence]], Deep Learning (DL), [[Hardware]], [[Optimization]]
|
||||
- [[Efficiency|Efficiency]], [[Physical-Intelligence|Physical-Intelligence]], Deep Learning (DL), [[Hardware|Hardware]], [[Optimization|Optimization]]
|
||||
- **Modern Tech/Tools**: TensorRT, GGUF (LLM), bitsandbytes, INT8/FP4 calculation.
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user