---
id: P-REINFORCE-AUTO-GATH-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.96
tags: [auto-reinforced, game-theory, strategy, nash-equilibrium, incentives, mechanism-design]
last_reinforced: 2026-04-20
---

# [[Game-Theory]]

## 📌 한 줄 통찰 (The Karpathy Summary)
> "상대방의 머릿속을 읽는 수학: 나의 이익이 내 선택뿐만 아니라 타인의 선택에 의해서도 결정될 때, 합리적인 행위자들이 어떤 전략을 선택하고 그 결과 상호작용이 어떻게 균형(Equilibrium)에 도달하는지 분석하는 전략의 미학."

## 📖 구조화된 지식 (Synthesized Content)
게임 이론(Game-Theory)은 상충하거나 협력하는 이해관계를 가진 의사결정자들 사이의 전략적 상호작용을 연구하는 학문입니다.

1.  **핵심 개념**:
    *   **Nash Equilibrium (내시 균형)**: 상대방의 전략이 주어졌을 때, 누구도 자신의 전략을 바꿀 유인이 없는 상태.
    *   **Prisoners Dilemma (죄수의 딜레마)**: 개별적으론 합리적인 선택이 집단 전체적으로는 최악의 결과를 가져오는 모순.
    *   **Zero-sum vs Non-zero-sum**: 한쪽의 이득이 다른 쪽의 손해인 게임과 상생이 가능한 게임의 구분.
2.  **왜 중요한가?**:
    *   경제학, 군사학, 생물학, 그리고 인공지능이 복수의 에이전트(Multi-agent) 환경에서 어떻게 협력하고 경쟁해야 하는지 가르쳐주는 기본 설계도임.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 '완벽하게 합리적인 행위자 정책'을 가정했으나, 현대 정책은 '진화 게임 이론 정책'을 통해 반복되는 상호작용 속에서 전략이 어떻게 살아남고 진화하는지 분석함(RL Update). (Evolutionary-Algorithms와 연결)
- **정책 변화(RL Update)**: AI 정렬 정책부(Alignment)에서, 시스템이 인간의 피드백을 속이지 않고 정직하게 답하도록 하는 '메커니즘 디자인 정책'의 핵심 근간으로 활용됨.

## 🔗 지식 연결 (Graph)
- [[Decision Theory]], [[Economic-Analysis]], [[GAN]], [[Evolutionary-Algorithms]], [[Collective-Intelligence]]
- **Modern Tech/Tools**: Multi-agent RL (MARL), Mechanism design, Competitive analysis.
---