feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup
This commit is contained in:
@@ -1,12 +1,12 @@
|
||||
---
|
||||
id: RL-REPLAY-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [reinforcement-learning, ai, experience-replay, dqn, stable-learning]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Experience Replay (경험 재플레이)]]
|
||||
# Experience Replay (경험 재플레이)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "과거의 경험을 망각 속에 버리지 말고, 무작위로 꺼내어 현재의 지능을 다져라" — 에이전트가 환경과 상호작용하며 얻은 경험 데이터($s, a, r, s'$)를 버퍼에 저장하고, 학습 시 이들을 무작위로 샘플링하여 사용하여 학습의 상관관계를 끊고 효율을 높이는 기법.
|
||||
@@ -25,5 +25,5 @@ last_reinforced: 2026-04-26
|
||||
- **정책 변화:** Skybound 프로젝트의 적 기체 AI는 플레이어와의 교전 이력을 Replay Buffer에 저장하고, 이를 통해 다양한 플레이어의 전술에 범용적으로 대응하는 강건한 정책을 구축함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Deep-Q-Networks-DQN]], [[Reinforcement-Learning]], [[Q-Learning-Foundations]], [[Neural-Networks-Foundations]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Experience-Replay.md]]
|
||||
- [[Deep-Q-Networks-DQN]], [[Reinforcement-Learning]], Q-Learning-Foundations, Neural-Networks-Foundations
|
||||
- **Raw Source:** 10_Wiki/Topics/AI/Experience-Replay.md
|
||||
|
||||
Reference in New Issue
Block a user