docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, active-learning, machine-learning, optimization, data-ef
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Active Learning]]
|
||||
# [[Active Learning|Active Learning]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "똑똑하게 질문해서 배우기: 모든 데이터를 맹목적으로 학습하는 대신, 정답을 알았을 때 모델의 지능이 가장 크게 상승할 것 같은 '핵심 질문(데이터)'만 골라 인간에게 정답을 요청하는 고효율 학습 전략."
|
||||
@@ -28,6 +28,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: 인간과의 상호작용 피로도를 낮추기 위해, "꼭 필요한 질문만 던지는" 에이전트의 예절 및 효율성 알고리즘을 최적화하는 정책이 RAG 부문 및 도메인 특화 모델 개발의 표준이 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[SFT (Supervised Fine-Tuning)]], [[RLHF (인간 피드백 기반 강화 학습)]], [[Resource-Management]], [[Decision Theory]], [[Scientific Communication]]
|
||||
- [[SFT (Supervised Fine-Tuning)|SFT (Supervised Fine-Tuning)]], [[RLHF (인간 피드백 기반 강화 학습)|RLHF (인간 피드백 기반 강화 학습)]], [[Resource-Management|Resource-Management]], [[Decision Theory|Decision Theory]], [[Scientific Communication|Scientific Communication]]
|
||||
- **Modern Tech/Tools**: Prodigy (Labeling tool), ModAL (Python framework for Active Learning).
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user