[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,5 +1,5 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-DQN
|
||||
id: [[P-Reinforce]]-AI-DQN
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.97
|
||||
tags: [ReinforcementLearning, DQN, DeepMind, QLearning]
|
||||
@@ -12,7 +12,7 @@ last_reinforced: 2026-04-20
|
||||
> "고전 게임기를 정복한 딥러닝과 강화학습의 사상 첫 번째 결합." 상태 가치를 예측하는 고전적인 Q-Learning에 심층 신경망을 도입하여 픽셀 정보만으로 인간 이상의 게임 실력을 달성한 기념비적 논문이다.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **Key Innovations**:
|
||||
- **Key [[Innovation]]s**:
|
||||
- **Deep Neural Network as Q-Function**: 복잡하고 고차원적인 상태(예: 화면 픽셀)를 입력받아 각 행동의 가치를 계산하도록 CNN을 사용함.
|
||||
- **Experience Replay**: 경험한 데이터를 메모리에 저장해두고 무작위로 추출하여 학습함으로써 데이터 간 상관관계(Correlation)를 끊고 안정성을 확보함.
|
||||
- **Target Network**: 가치 예측값과 목표값을 계산하는 네트워크를 분리하여 학습 중 목표값이 요동치는 현상을 방지함.
|
||||
|
||||
Reference in New Issue
Block a user