docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

This commit is contained in:
Antigravity Agent
2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
+2 -2
View File
@@ -6,7 +6,7 @@ tags: [ReinforcementLearning, DQN, DeepMind, QLearning]
last_reinforced: 2026-04-20
---
# [[Deep Q-Networks (DQN)]]
# [[Deep Q-Networks (DQN)|Deep Q-Networks (DQN)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "고전 게임기를 정복한 딥러닝과 강화학습의 사상 첫 번째 결합." 상태 가치를 예측하는 고전적인 Q-Learning에 심층 신경망을 도입하여 픽셀 정보만으로 인간 이상의 게임 실력을 달성한 기념비적 논문이다.
@@ -22,5 +22,5 @@ last_reinforced: 2026-04-20
- DQN은 가치 기반(Value-based) 방식이기에 행동 공간이 연속적인(Continuous) 문제에는 적용하기 어렵다. 또한 가치 값을 과대평가(Overestimation)하는 경향이 있어, 이를 보완한 Double DQN, Dueling DQN 등으로 진화하였다.
## 🔗 지식 연결 (Graph)
- Related: [[Reinforcement Learning (RL)]] , [[Bellman-Equation]]
- Related: [[Reinforcement Learning (RL)|Reinforcement Learning (RL)]] , [[Bellman-Equation|Bellman-Equation]]
- Contrast: Policy Gradient Methods