feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup
This commit is contained in:
@@ -1,12 +1,12 @@
|
||||
---
|
||||
id: COMP-NEURO-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [neuroscience, reinforcement-learning, dopamine, brain-modeling]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Computational Neuroscience of Reinforcement Learning (강화학습의 계산 신경과학)]]
|
||||
# Computational Neuroscience of Reinforcement Learning (강화학습의 계산 신경과학)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "인간의 학습 메커니즘을 수학적 강화학습 언어로 해독하라" — 뇌의 보상 시스템과 도파민 분비 기제를 시간차 학습(TD Learning) 및 가치 기반 선택 모델로 설명하려는 뇌과학과 AI의 융합 학문.
|
||||
@@ -23,6 +23,6 @@ last_reinforced: 2026-04-26
|
||||
- **정책 변화:** Antigravity 에이전트의 보상 함수 설계 시, 인간의 '만족도 지연' 기제를 참고하여 장기적 목표 달성 확률을 높이는 로직 적용.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- **Parent:** [[10_Wiki/💡 Topics/AI]]
|
||||
- **Related:** [[Dopamine-RPE]], [[TD-Learning]], [[Basal-Ganglia]], [[Decision-Making]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Computational Neuroscience of Reinforcement Learning.md]]
|
||||
- **Parent:** 10_Wiki/💡 Topics/AI
|
||||
- **Related:** Dopamine-RPE, TD-Learning, Basal-Ganglia, Decision-Making
|
||||
- **Raw Source:** 10_Wiki/Topics/AI/Computational Neuroscience of Reinforcement Learning.md
|
||||
|
||||
Reference in New Issue
Block a user