docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

This commit is contained in:
Antigravity Agent
2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
+4 -4
View File
@@ -2,17 +2,17 @@
id: DQN-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [[[Reinforcement-Learning]], ai, dqn, q-learning, [[Deep-Learning]]]
tags: [[Reinforcement-Learning|[Reinforcement-Learning]], ai, dqn, q-learning, [[Deep-Learning|Deep-Learning]]]
last_reinforced: 2026-04-26
---
# [[Deep Q-Networks (DQN)]]
# [[Deep Q-Networks (DQN)|Deep Q-Networks (DQN)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "강화학습의 의사결정 테이블을 거대 신경망으로 대체하여 무한한 복잡성에 도전하라" — 고전적 Q-Learning의 테이블 방식 한계를 딥러닝으로 극복하여, 아타리 게임을 인간 수준으로 정복하며 심층 강화학습(Deep RL)의 시대를 연 모델.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** 상태([[State]])를 입력받아 각 행동(Action)의 가치(Q-value)를 예측하는 함수를 신경망으로 근사하고, 경험 재플레이와 타겟 네트워크를 통해 학습을 안정화하는 패턴.
- **추출된 패턴:** 상태([[State|State]])를 입력받아 각 행동(Action)의 가치(Q-value)를 예측하는 함수를 신경망으로 근사하고, 경험 재플레이와 타겟 네트워크를 통해 학습을 안정화하는 패턴.
- **핵심 기술:**
- **Experience Replay:** 에이전트의 경험($s, a, r, s'$)을 메모리에 저장하고 무작위로 추출하여 학습함으로써 데이터 간 상관관계를 끊고 학습 효율 증대.
- **Target Network:** 가치 계산용 네트워크를 별도로 분리하여 학습 중 목표값이 요동치는 현상 방지.
@@ -24,5 +24,5 @@ last_reinforced: 2026-04-26
- **정책 변화:** Skybound 프로젝트의 복잡한 적 AI 행동 패턴 학습 시 DQN 아키텍처를 기본 모델로 사용하며, Double DQN이나 Dueling DQN 등 개선된 기법을 적용함.
## 🔗 지식 연결 (Graph)
- Q-Learning-Foundations, [[Reinforcement-Learning]], Deep-Learning-Foundations, [[Experience-Replay]]
- Q-Learning-Foundations, [[Reinforcement-Learning|Reinforcement-Learning]], Deep-Learning-Foundations, [[Experience-Replay|Experience-Replay]]
- **Raw Source:** 10_Wiki/Topics/AI/Deep-Q-Networks-DQN.md