feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup

This commit is contained in:
2026-04-27 18:58:22 +09:00
parent 3424166ea2
commit 6b86b0da4c
2706 changed files with 9074 additions and 7273 deletions
@@ -1,12 +1,12 @@
---
id: P-REINFORCE-SCI-CONDITIONING
category: "[[10_Wiki/💡 Topics/Science]]"
category: "10_Wiki/💡 Topics/Science"
confidence_score: 0.97
tags: [Conditioning, Behavioral Science, Learning, Psychology]
last_reinforced: 2026-04-20
---
# [[Conditioning-and-Learning]] (조건 형성과 학습)
# Conditioning-and-Learning (조건 형성과 학습)
## 📌 한 줄 통찰 (The Karpathy Summary)
> "행동은 보상의 결과물이다." 자극과 반응이 결합하여 습관이 되고, 보상의 타이밍에 따라 행동이 강화되거나 사라지는 메커니즘이다.
@@ -23,5 +23,5 @@ last_reinforced: 2026-04-20
- 인간은 단순히 보상에만 따라 움직이는 존재가 아니다(행동주의의 한계). 사회적 학습(관찰 학습)과 내면의 필터링이 작용한다. AI 분야의 강화학습(RL)은 이 조작적 조건 형성을 수학적으로 모델링하여 기계가 스스로 전략을 찾게 만든다.
## 🔗 지식 연결 (Graph)
- Related: [[Behavioral-Economics]] , [[Cognitive Evaluation Theory]]
- Foundation: [[Reinforcement Learning]]
- Related: [[Behavioral-Economics]] , Cognitive Evaluation Theory
- Foundation: Reinforcement Learning