37 lines
2.9 KiB
Markdown
37 lines
2.9 KiB
Markdown
---
|
|
id: GAME-THEORY-AI-001
|
|
date: 2026-05-07T14:56:00.000Z
|
|
type: knowledge_artifact
|
|
standard: P-Reinforce v3.0
|
|
tags: [game-theory, ai, multi-agent-systems, reinforcement-learning, strategic-decision-making]
|
|
---
|
|
|
|
# [[Game-Theory-in-AI]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "상호작용의 지능화: 다중 에이전트 환경에서 각 주체의 최적 전략이 서로에게 미치는 영향을 수학적으로 모델링하여, 복잡한 경쟁 및 협력 상황에서 최적의 균형점(Equilibrium)을 찾는 인공지능 설계 원칙."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
게임 이론은 현대 인공지능, 특히 다중 에이전트 강화학습(MARL)과 자율 시스템 설계에서 의사결정의 핵심 논리를 제공합니다.
|
|
|
|
1. **핵심 개념 및 균형점**:
|
|
* **내시 균형 (Nash Equilibrium)**: 다른 에이전트의 전략이 고정되었을 때, 어떤 에이전트도 자신의 전략을 변경하여 더 높은 이득을 얻을 수 없는 상태입니다. AI는 이 균형점을 향해 학습하며 시스템의 안정성을 확보합니다.
|
|
* **제로섬 vs 비제로섬 게임**: 자원이 한정된 경쟁 상황(Zero-sum)과 협력을 통해 공동의 이익을 창출할 수 있는 상황(Non-zero-sum)을 구분하여 보상 함수(Reward Function)를 설계합니다.
|
|
2. **AI 분야의 응용**:
|
|
* **Multi-Agent Reinforcement Learning (MARL)**: 여러 AI 에이전트가 동시에 학습하는 환경에서 상호 간의 간섭을 게임 이론적으로 해결합니다.
|
|
* **메커니즘 디자인 (Mechanism Design)**: 에이전트들이 자신의 이익을 위해 행동하더라도 전체 시스템이 원하는 방향(예: 자원 효율성)으로 유도되도록 규칙과 보상 구조를 설계합니다.
|
|
3. **실전 사례**:
|
|
* **AlphaGo & Poker AI**: 불완전 정보 게임(Poker)이나 복잡한 상태 공간(Go)에서 상대의 전략을 예측하고 최적의 대응수를 계산하는 데 필수적으로 사용됩니다.
|
|
* **자율주행 및 드론 스웜**: 여러 자율 주행 차량이 교차로에서 충돌 없이 효율적으로 통행하기 위한 전략적 상호작용 모델링에 활용됩니다.
|
|
|
|
## ⚖️ Trade-offs & Caveats
|
|
* **계산 복잡도**: 에이전트 수가 증가할수록 내시 균형을 찾는 계산량이 기하급수적으로 늘어나는 '차원의 저주' 문제가 발생합니다.
|
|
* **합리성 가정의 한계**: 현실의 에이전트(인간 포함)는 항상 완벽하게 합리적으로 행동하지 않으므로, 제한된 합리성(Bounded Rationality)을 고려한 모델링이 필요합니다.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- **Related Topics**: [[Reinforcement Learning (RL)]], [[Multi-Agent-Systems-MAS]], [[Bounded Rationality]], [[Algorithmic-Game-Theory]]
|
|
- **Applications**: [[Autonomous Vehicles]], [[Artificial-Intelligence-in-Games]]
|
|
|
|
---
|
|
*Last updated: 2026-05-07*
|