feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup

This commit is contained in:
2026-04-27 18:58:22 +09:00
parent 3424166ea2
commit 6b86b0da4c
2706 changed files with 9074 additions and 7273 deletions
+3 -3
View File
@@ -1,12 +1,12 @@
---
id: RL-REWARD-SHAPE-001
category: "[[10_Wiki/💡 Topics/AI]]"
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [ai, reinforcement-learning, reward-shaping, reward-design, sparse-rewards, behavior-steering]
last_reinforced: 2026-04-26
---
# [[Reward Shaping in RL (강화학습에서의 보상 설계)]]
# Reward Shaping in RL (강화학습에서의 보상 설계)
## 📌 한 줄 통찰 (The Karpathy Summary)
> "최종 목표라는 커다란 보상을 향해 가기 위해, 에이전트의 발걸음마다 '올바른 방향'을 가리키는 작은 이정표(Sub-rewards)를 설계하라" — 보상이 희소한(Sparse Reward) 환경에서 학습 속도를 높이기 위해 보상 함수에 추가적인 지침을 더하는 기법.
@@ -25,4 +25,4 @@ last_reinforced: 2026-04-26
## 🔗 지식 연결 (Graph)
- [[Reinforcement-Learning]], [[Positive-Reinforcement]], [[Markov-Decision-Process-MDP]], [[Exploration-vs-Exploitation]]
- **Raw Source:** [[10_Wiki/Topics/AI/Reward-Shaping-in-RL.md]]
- **Raw Source:** 10_Wiki/Topics/AI/Reward-Shaping-in-RL.md