[G1-Sync] Manual knowledge update

2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
@@ -1,8 +1,8 @@
 ---
-id: P-REINFORCE-AI-DOPAMINE
+id: [[P-Reinforce]]-AI-[[Dopamine]]
 category: "10_Wiki/💡 Topics/AI"
 confidence_score: 0.97
-tags: [Neuroscience, Psychology, RewardSystem, Dopamine]
+tags: [Neuroscience, [[Psychology]], RewardSystem, Dopamine]
 last_reinforced: 2026-04-20
 ---

@@ -12,7 +12,7 @@ last_reinforced: 2026-04-20
 > "쾌락의 호르몬이 아니라, '기대'와 '학습'의 엔진." 뇌에서 예상치 못한 보상을 받았을 때 분비되어 그 행동을 반복하게 만드는 강력한 강화학습(Reinforcement Learning) 시스템의 생물학적 기원이다.

 ## 📖 구조화된 지식 (Synthesized Content)
- **Reward Prediction Error (RPE)**: 도파민은 보상을 받을 때보다 '예상보다 더 좋은 결과'가 나왔을 때 가장 많이 분비된다. (기대치와 실제의 차이가 학습의 신호가 됨)
+- **[[Reward Prediction Error]] (RPE)**: 도파민은 보상을 받을 때보다 '예상보다 더 좋은 결과'가 나왔을 때 가장 많이 분비된다. (기대치와 실제의 차이가 학습의 신호가 됨)
 - **Core Pathways**:
    - **Mesolimbic Pathway**: 동기 부여 및 중독과 관련 (복측 피개 영역 $\to$ 측좌핵).
    - **Mesocortical Pathway**: 인지 제어 및 의사결정과 관련 (전전두엽 연결).