feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup

This commit is contained in:
2026-04-27 18:58:22 +09:00
parent 3424166ea2
commit 6b86b0da4c
2706 changed files with 9074 additions and 7273 deletions
+4 -4
View File
@@ -1,12 +1,12 @@
---
id: RL-REPLAY-001
category: "[[10_Wiki/💡 Topics/AI]]"
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [reinforcement-learning, ai, experience-replay, dqn, stable-learning]
last_reinforced: 2026-04-26
---
# [[Experience Replay (경험 재플레이)]]
# Experience Replay (경험 재플레이)
## 📌 한 줄 통찰 (The Karpathy Summary)
> "과거의 경험을 망각 속에 버리지 말고, 무작위로 꺼내어 현재의 지능을 다져라" — 에이전트가 환경과 상호작용하며 얻은 경험 데이터($s, a, r, s'$)를 버퍼에 저장하고, 학습 시 이들을 무작위로 샘플링하여 사용하여 학습의 상관관계를 끊고 효율을 높이는 기법.
@@ -25,5 +25,5 @@ last_reinforced: 2026-04-26
- **정책 변화:** Skybound 프로젝트의 적 기체 AI는 플레이어와의 교전 이력을 Replay Buffer에 저장하고, 이를 통해 다양한 플레이어의 전술에 범용적으로 대응하는 강건한 정책을 구축함.
## 🔗 지식 연결 (Graph)
- [[Deep-Q-Networks-DQN]], [[Reinforcement-Learning]], [[Q-Learning-Foundations]], [[Neural-Networks-Foundations]]
- **Raw Source:** [[10_Wiki/Topics/AI/Experience-Replay.md]]
- [[Deep-Q-Networks-DQN]], [[Reinforcement-Learning]], Q-Learning-Foundations, Neural-Networks-Foundations
- **Raw Source:** 10_Wiki/Topics/AI/Experience-Replay.md