feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup
This commit is contained in:
@@ -1,12 +1,12 @@
|
||||
---
|
||||
id: AI-OPT-QUAN-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, deep-learning, quantization, model-compression, int8, fp16, optimization, inference-speedup]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Quantization Foundations (양자화 기초)]]
|
||||
# Quantization Foundations (양자화 기초)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "정밀한 부동소수점(FP32)의 사치를 버리고 거친 정수(INT8)의 효율을 선택하여, 지능을 비트 단위로 압축하고 실행 속도를 극한으로 끌어올려라" — 신경망의 가중치와 활성화 함수 값을 더 낮은 비트의 정밀도로 표현함으로써 모델 크기를 줄이고 추론 속도를 높이는 최적화 기술.
|
||||
@@ -24,5 +24,5 @@ last_reinforced: 2026-04-26
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 온디바이스 배포 및 추론 비용 절감을 위해, 모든 주력 모델에 대해 INT8 혹은 FP16 양자화를 기본 적용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Pruning-Techniques]], [[Model-Compression-and-Deployment]], [[NVIDIA-CUDA-and-AI]], [[Optimization-in-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Quantization-Foundations.md]]
|
||||
- [[Pruning-Techniques]], Model-Compression-and-Deployment, [[NVIDIA-CUDA-and-AI]], [[Optimization-in-AI]]
|
||||
- **Raw Source:** 10_Wiki/Topics/AI/Quantization-Foundations.md
|
||||
|
||||
Reference in New Issue
Block a user