chore(wiki): reinforce knowledge batch #6-#10 (200 docs milestone)
This commit is contained in:
@@ -1,31 +1,28 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-GATH-001
|
||||
id: GAME-THEORY-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 0.96
|
||||
tags: [auto-reinforced, game-theory, strategy, nash-equilibrium, incentives, mechanism-design]
|
||||
last_reinforced: 2026-04-20
|
||||
confidence_score: 1.0
|
||||
tags: [math, decision-theory, economics, ai-strategy]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Game-Theory]]
|
||||
# [[Game Theory (게임 이론)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "상대방의 머릿속을 읽는 수학: 나의 이익이 내 선택뿐만 아니라 타인의 선택에 의해서도 결정될 때, 합리적인 행위자들이 어떤 전략을 선택하고 그 결과 상호작용이 어떻게 균형(Equilibrium)에 도달하는지 분석하는 전략의 미학."
|
||||
> "상대방의 전략을 고려한 최선의 선택을 수학적으로 분석하라" — 독립적인 의사결정자들이 서로의 선택이 자신의 결과에 영향을 미치는 상황(전략적 상호작용)에서 어떻게 행동하는지 연구하는 학문.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
게임 이론(Game-Theory)은 상충하거나 협력하는 이해관계를 가진 의사결정자들 사이의 전략적 상호작용을 연구하는 학문입니다.
|
||||
|
||||
1. **핵심 개념**:
|
||||
* **Nash Equilibrium (내시 균형)**: 상대방의 전략이 주어졌을 때, 누구도 자신의 전략을 바꿀 유인이 없는 상태.
|
||||
* **Prisoners Dilemma (죄수의 딜레마)**: 개별적으론 합리적인 선택이 집단 전체적으로는 최악의 결과를 가져오는 모순.
|
||||
* **Zero-sum vs Non-zero-sum**: 한쪽의 이득이 다른 쪽의 손해인 게임과 상생이 가능한 게임의 구분.
|
||||
2. **왜 중요한가?**:
|
||||
* 경제학, 군사학, 생물학, 그리고 인공지능이 복수의 에이전트(Multi-agent) 환경에서 어떻게 협력하고 경쟁해야 하는지 가르쳐주는 기본 설계도임.
|
||||
- **추출된 패턴:** 상대방이 자신의 이익을 극대화한다는 가정 하에, 자신의 기대 보상을 최대화하는 '내쉬 균형(Nash Equilibrium)' 지점을 찾아가는 의사결정 패턴.
|
||||
- **세부 내용:**
|
||||
- **Zero-sum Game:** 한쪽의 이득이 다른 쪽의 손실이 되는 대립 관계 (예: 장기, 바둑).
|
||||
- **Prisoner's Dilemma:** 각자에게는 최선의 선택이 전체적으로는 최악의 결과를 낳는 협력의 딜레마 분석.
|
||||
- **Dominant Strategy:** 상대방이 무엇을 하든 상관없이 자신에게 가장 유리한 전략.
|
||||
- **Minimax Algorithm:** AI 체스/바둑 등에서 최악의 시나리오를 가정하고 손실을 최소화하는 경로 탐색.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌**: 과거에는 '완벽하게 합리적인 행위자 정책'을 가정했으나, 현대 정책은 '진화 게임 이론 정책'을 통해 반복되는 상호작용 속에서 전략이 어떻게 살아남고 진화하는지 분석함(RL Update). (Evolutionary-Algorithms와 연결)
|
||||
- **정책 변화(RL Update)**: AI 정렬 정책부(Alignment)에서, 시스템이 인간의 피드백을 속이지 않고 정직하게 답하도록 하는 '메커니즘 디자인 정책'의 핵심 근간으로 활용됨.
|
||||
- **과거 데이터와의 충돌:** 완전한 합리성을 전제로 하던 초기 모델에서, 진화 게임 이론(Evolutionary Game Theory) 및 행동 게임 이론을 통해 비합리성과 생물학적 진화 과정을 포괄하는 모델로 확장.
|
||||
- **정책 변화:** Antigravity 에이전트의 다중 에이전트 협업(Multi-agent Collaboration) 설계 시, 개인의 이익과 팀의 목표가 일치하도록 '메커니즘 디자인' 이론을 적용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Decision Theory]], [[Economic-Analysis]], [[GAN]], [[Evolutionary-Algorithms]], [[Collective-Intelligence]]
|
||||
- **Modern Tech/Tools**: Multi-agent RL (MARL), Mechanism design, Competitive analysis.
|
||||
---
|
||||
- [[Decision-Theory]], [[Expected-Utility-Theory]], [[Nash-Equilibrium]], [[Mechanism-Design]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Game-Theory.md]]
|
||||
|
||||
Reference in New Issue
Block a user