[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+3 -3
View File
@@ -1,8 +1,8 @@
---
id: P-REINFORCE-AI-DOPAMINE
id: [[P-Reinforce]]-AI-[[Dopamine]]
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.97
tags: [Neuroscience, Psychology, RewardSystem, Dopamine]
tags: [Neuroscience, [[Psychology]], RewardSystem, Dopamine]
last_reinforced: 2026-04-20
---
@@ -12,7 +12,7 @@ last_reinforced: 2026-04-20
> "쾌락의 호르몬이 아니라, '기대'와 '학습'의 엔진." 뇌에서 예상치 못한 보상을 받았을 때 분비되어 그 행동을 반복하게 만드는 강력한 강화학습(Reinforcement Learning) 시스템의 생물학적 기원이다.
## 📖 구조화된 지식 (Synthesized Content)
- **Reward Prediction Error (RPE)**: 도파민은 보상을 받을 때보다 '예상보다 더 좋은 결과'가 나왔을 때 가장 많이 분비된다. (기대치와 실제의 차이가 학습의 신호가 됨)
- **[[Reward Prediction Error]] (RPE)**: 도파민은 보상을 받을 때보다 '예상보다 더 좋은 결과'가 나왔을 때 가장 많이 분비된다. (기대치와 실제의 차이가 학습의 신호가 됨)
- **Core Pathways**:
- **Mesolimbic Pathway**: 동기 부여 및 중독과 관련 (복측 피개 영역 $\to$ 측좌핵).
- **Mesocortical Pathway**: 인지 제어 및 의사결정과 관련 (전전두엽 연결).