chore(wiki): reinforce knowledge batch #6-#10 (200 docs milestone)

2026-04-26 15:07:47 +09:00
parent f541717fe1
commit c612160a13
265 changed files with 8026 additions and 1113 deletions
@@ -1,31 +1,28 @@
 ---
-id: P-REINFORCE-AUTO-GATH-001
+id: GAME-THEORY-001
 category: "[[10_Wiki/💡 Topics/AI]]"
-confidence_score: 0.96
-tags: [auto-reinforced, game-theory, strategy, nash-equilibrium, incentives, mechanism-design]
-last_reinforced: 2026-04-20
+confidence_score: 1.0
+tags: [math, decision-theory, economics, ai-strategy]
+last_reinforced: 2026-04-26
 ---

-# [[Game-Theory]]
+# [[Game Theory (게임 이론)]]

 ## 📌 한 줄 통찰 (The Karpathy Summary)
-> "상대방의 머릿속을 읽는 수학: 나의 이익이 내 선택뿐만 아니라 타인의 선택에 의해서도 결정될 때, 합리적인 행위자들이 어떤 전략을 선택하고 그 결과 상호작용이 어떻게 균형(Equilibrium)에 도달하는지 분석하는 전략의 미학."
+> "상대방의 전략을 고려한 최선의 선택을 수학적으로 분석하라" — 독립적인 의사결정자들이 서로의 선택이 자신의 결과에 영향을 미치는 상황(전략적 상호작용)에서 어떻게 행동하는지 연구하는 학문.

 ## 📖 구조화된 지식 (Synthesized Content)
-게임 이론(Game-Theory)은 상충하거나 협력하는 이해관계를 가진 의사결정자들 사이의 전략적 상호작용을 연구하는 학문입니다.
-
-1.  **핵심 개념**:
-    *   **Nash Equilibrium (내시 균형)**: 상대방의 전략이 주어졌을 때, 누구도 자신의 전략을 바꿀 유인이 없는 상태.
-    *   **Prisoners Dilemma (죄수의 딜레마)**: 개별적으론 합리적인 선택이 집단 전체적으로는 최악의 결과를 가져오는 모순.
-    *   **Zero-sum vs Non-zero-sum**: 한쪽의 이득이 다른 쪽의 손해인 게임과 상생이 가능한 게임의 구분.
-2.  **왜 중요한가?**:
-    *   경제학, 군사학, 생물학, 그리고 인공지능이 복수의 에이전트(Multi-agent) 환경에서 어떻게 협력하고 경쟁해야 하는지 가르쳐주는 기본 설계도임.
+- **추출된 패턴:** 상대방이 자신의 이익을 극대화한다는 가정 하에, 자신의 기대 보상을 최대화하는 '내쉬 균형(Nash Equilibrium)' 지점을 찾아가는 의사결정 패턴.
+- **세부 내용:**
+    - **Zero-sum Game:** 한쪽의 이득이 다른 쪽의 손실이 되는 대립 관계 (예: 장기, 바둑).
+    - **Prisoner's Dilemma:** 각자에게는 최선의 선택이 전체적으로는 최악의 결과를 낳는 협력의 딜레마 분석.
+    - **Dominant Strategy:** 상대방이 무엇을 하든 상관없이 자신에게 가장 유리한 전략.
+    - **Minimax Algorithm:** AI 체스/바둑 등에서 최악의 시나리오를 가정하고 손실을 최소화하는 경로 탐색.

 ## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 '완벽하게 합리적인 행위자 정책'을 가정했으나, 현대 정책은 '진화 게임 이론 정책'을 통해 반복되는 상호작용 속에서 전략이 어떻게 살아남고 진화하는지 분석함(RL Update). (Evolutionary-Algorithms와 연결)
- **정책 변화(RL Update)**: AI 정렬 정책부(Alignment)에서, 시스템이 인간의 피드백을 속이지 않고 정직하게 답하도록 하는 '메커니즘 디자인 정책'의 핵심 근간으로 활용됨.
+- **과거 데이터와의 충돌:** 완전한 합리성을 전제로 하던 초기 모델에서, 진화 게임 이론(Evolutionary Game Theory) 및 행동 게임 이론을 통해 비합리성과 생물학적 진화 과정을 포괄하는 모델로 확장.
+- **정책 변화:** Antigravity 에이전트의 다중 에이전트 협업(Multi-agent Collaboration) 설계 시, 개인의 이익과 팀의 목표가 일치하도록 '메커니즘 디자인' 이론을 적용함.

 ## 🔗 지식 연결 (Graph)
- [[Decision Theory]], [[Economic-Analysis]], [[GAN]], [[Evolutionary-Algorithms]], [[Collective-Intelligence]]
- **Modern Tech/Tools**: Multi-agent RL (MARL), Mechanism design, Competitive analysis.
---
+- [[Decision-Theory]], [[Expected-Utility-Theory]], [[Nash-Equilibrium]], [[Mechanism-Design]]
+- **Raw Source:** [[10_Wiki/Topics/AI/Game-Theory.md]]