[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
@@ -2,7 +2,7 @@
id: COMP-NEURO-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [neuroscience, reinforcement-learning, dopamine, brain-modeling]
tags: [neuroscience, [[Reinforcement-Learning]], [[Dopamine]], brain-modeling]
last_reinforced: 2026-04-26
---
@@ -14,9 +14,9 @@ last_reinforced: 2026-04-26
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** 실제 생물학적 뉴런의 활동과 강화학습 알고리즘(예: Q-Learning) 간의 상관관계를 모델링하여 학습의 생물학적 하드웨어 원리를 파악하는 패턴.
- **세부 내용:**
- **Reward Prediction Error (RPE):** 도파민 뉴런이 보상 자체가 아닌, '기대와 실제 보상의 차이'에 반응한다는 사실을 TD 에러 모델로 증명.
- **[[Reward Prediction Error]] (RPE):** 도파민 뉴런이 보상 자체가 아닌, '기대와 실제 보상의 차이'에 반응한다는 사실을 TD 에러 모델로 증명.
- **Basal Ganglia Modeling:** 뇌의 기저핵이 가치 함수를 저장하고 행동 선택을 수행하는 액터-크리틱(Actor-Critic) 구조와 유사함을 분석.
- **Exploration vs Exploitation:** 전전두엽과 줄무늬체 간의 상호작용을 통해 미지의 보상을 탐색할지, 기존 보상을 취할지 결정하는 메커니즘 수치화.
- **[[Exploration vs Exploitation]]:** 전전두엽과 줄무늬체 간의 상호작용을 통해 미지의 보상을 탐색할지, 기존 보상을 취할지 결정하는 메커니즘 수치화.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순 조건 반사(Pavlovian) 모델에서 현대의 정교한 예측 부호화(Predictive Coding) 및 계층적 RL 모델로 확장.