docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, batch-inference, ai-optimization, throughput, cost-effic
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Batch-Inference]]
|
||||
# [[Batch-Inference|Batch-Inference]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "지능의 공동 구매: 매 요청마다 AI를 즉각 깨우는 대신, 대량의 데이터를 한데 모아 한꺼번에 추론함으로써 서버 자원의 낭비를 줄이고 처리 속도(Throughput)를 극대화하는 물류적 최적화."
|
||||
@@ -28,6 +28,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: 대규모 에이전트 워크플로우 정책에서, 에이전트가 생성한 중간 결과물들을 배치로 모아 리랭킹(Re-ranking)하거나 요약하는 '간헐적 배치 처리 정책'이 시스템 무결성 확보의 핵심 가이드라인이 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Optimization]], [[Technical-Architecture]], [[Availability-and-Persistence]], [[Workflow-Integrity]], [[Scalability]]
|
||||
- [[Optimization|Optimization]], [[Technical-Architecture|Technical-Architecture]], [[Availability-and-Persistence|Availability-and-Persistence]], [[Workflow-Integrity|Workflow-Integrity]], [[Scalability|Scalability]]
|
||||
- **Modern Tech/Tools**: Apache Airflow, NVIDIA Triton Inference Server, Ray.
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user