--- id: GAME-THEORY-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [math, decision-theory, economics, ai-strategy] last_reinforced: 2026-04-26 --- # Game Theory (κ²Œμž„ 이둠) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μƒλŒ€λ°©μ˜ μ „λž΅μ„ κ³ λ €ν•œ μ΅œμ„ μ˜ 선택을 μˆ˜ν•™μ μœΌλ‘œ λΆ„μ„ν•˜λΌ" β€” 독립적인 μ˜μ‚¬κ²°μ •μžλ“€μ΄ μ„œλ‘œμ˜ 선택이 μžμ‹ μ˜ 결과에 영ν–₯을 λ―ΈμΉ˜λŠ” 상황(μ „λž΅μ  μƒν˜Έμž‘μš©)μ—μ„œ μ–΄λ–»κ²Œ ν–‰λ™ν•˜λŠ”μ§€ μ—°κ΅¬ν•˜λŠ” ν•™λ¬Έ. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** μƒλŒ€λ°©μ΄ μžμ‹ μ˜ 이읡을 κ·ΉλŒ€ν™”ν•œλ‹€λŠ” κ°€μ • ν•˜μ—, μžμ‹ μ˜ κΈ°λŒ€ 보상을 μ΅œλŒ€ν™”ν•˜λŠ” '내쉬 κ· ν˜•(Nash Equilibrium)' 지점을 μ°Ύμ•„κ°€λŠ” μ˜μ‚¬κ²°μ • νŒ¨ν„΄. - **μ„ΈλΆ€ λ‚΄μš©:** - **Zero-sum Game:** ν•œμͺ½μ˜ 이득이 λ‹€λ₯Έ μͺ½μ˜ 손싀이 λ˜λŠ” λŒ€λ¦½ 관계 (예: μž₯κΈ°, λ°”λ‘‘). - **Prisoner's Dilemma:** κ°μžμ—κ²ŒλŠ” μ΅œμ„ μ˜ 선택이 μ „μ²΄μ μœΌλ‘œλŠ” μ΅œμ•…μ˜ κ²°κ³Όλ₯Ό λ‚³λŠ” ν˜‘λ ₯의 λ”œλ ˆλ§ˆ 뢄석. - **Dominant Strategy:** μƒλŒ€λ°©μ΄ 무엇을 ν•˜λ“  상관없이 μžμ‹ μ—κ²Œ κ°€μž₯ μœ λ¦¬ν•œ μ „λž΅. - **Minimax Algorithm:** AI 체슀/λ°”λ‘‘ λ“±μ—μ„œ μ΅œμ•…μ˜ μ‹œλ‚˜λ¦¬μ˜€λ₯Ό κ°€μ •ν•˜κ³  손싀을 μ΅œμ†Œν™”ν•˜λŠ” 경둜 탐색. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** μ™„μ „ν•œ 합리성을 μ „μ œλ‘œ ν•˜λ˜ 초기 λͺ¨λΈμ—μ„œ, μ§„ν™” κ²Œμž„ 이둠(Evolutionary Game Theory) 및 행동 κ²Œμž„ 이둠을 톡해 비합리성과 생물학적 μ§„ν™” 과정을 ν¬κ΄„ν•˜λŠ” λͺ¨λΈλ‘œ ν™•μž₯. - **μ •μ±… λ³€ν™”:** Antigravity μ—μ΄μ „νŠΈμ˜ 닀쀑 μ—μ΄μ „νŠΈ ν˜‘μ—…(Multi-agent Collaboration) 섀계 μ‹œ, 개인의 이읡과 νŒ€μ˜ λͺ©ν‘œκ°€ μΌμΉ˜ν•˜λ„λ‘ 'λ©”μ»€λ‹ˆμ¦˜ λ””μžμΈ' 이둠을 μ μš©ν•¨. ## πŸ”— 지식 μ—°κ²° (Graph) - Decision-Theory, Expected-Utility-Theory, Nash-Equilibrium, Mechanism-Design - **Raw Source:** 10_Wiki/Topics/AI/Game-Theory.md