--- id: P-REINFORCE-AI-CGT category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 0.99 tags: [Game Theory, Combinatorial, Logic, Math, Strategy] last_reinforced: 2026-04-20 --- # Combinatorial-Game-Theory (쑰합둠적 κ²Œμž„ 이둠 CGT) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > μš°μ—°λ„ μˆ¨κ²¨μ§„ 정보도 μ—†λŠ” 'μ™„μ „ 정보 κ²Œμž„'μ—μ„œ, μˆ˜ν•™μ μœΌλ‘œ ν•„μŠΉ μ „λž΅(Winning Strategy)이 λ°˜λ“œμ‹œ μ‘΄μž¬ν•¨μ„ 증λͺ…ν•˜κ³  μ°Ύμ•„λ‚΄λŠ” 지적 μœ ν¬λ‹€. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **Perfect Information Games**: - 체슀, λ°”λ‘‘, λ‹˜(Nim) κ²Œμž„μ²˜λŸΌ λͺ¨λ“  정보가 κ³΅κ°œλ˜μ–΄ 있고 μ£Όμ‚¬μœ„ 같은 ν™•λ₯  μš”μ†Œκ°€ μ—†λŠ” κ²Œμž„. - **Game Tree Search**: - λͺ¨λ“  κ°€λŠ₯ν•œ 수의 경둜λ₯Ό 트리 ꡬ쑰둜 λ‚˜νƒ€λ‚΄κ³ , 리프 λ…Έλ“œ(κ²°κ³Ό)μ—μ„œλΆ€ν„° μœ„λ‘œ 거슬러 μ˜¬λΌκ°€λ©° μ΅œμ„ μ˜ 수λ₯Ό μ°ΎλŠ” 방식. - **Normal Play Convention**: - "λ§ˆμ§€λ§‰ 수λ₯Ό λ‘λŠ” μ‚¬λžŒμ΄ 이긴닀"λŠ” κ·œμΉ™ ν•˜μ˜ μ „λž΅ 뢄석. κ²Œμž„μ„ 숫자(Value)둜 μΉ˜ν™˜ν•˜μ—¬ λ³΅μž‘ν•œ κ²Œμž„μ„ 더 λ‹¨μˆœν•œ κ²Œμž„μ˜ ν•©μœΌλ‘œ λΆ„ν•΄ν•œλ‹€. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (RL Update) - λ°”λ‘‘μ²˜λŸΌ 경우의 μˆ˜κ°€ 우주 μ›μž μˆ˜λ³΄λ‹€ λ§Žμ€ 경우, 고전적인 CGTλ§ŒμœΌλ‘œλŠ” 해결이 λΆˆκ°€λŠ₯ν•˜λ‹€. μ΄λ•Œ μ•ŒνŒŒκ³ μ²˜λŸΌ λ”₯λŸ¬λ‹κ³Ό λͺ¬ν…ŒμΉ΄λ₯Όλ‘œ 트리 탐색(MCTS)을 κ²°ν•©ν•˜μ—¬ '근사적 ν•„μŠΉ μ „λž΅'을 μ°ΎλŠ” λ°©μ‹μœΌλ‘œ ν˜„λŒ€μ  μ§„ν™”κ°€ 일어났닀. ## πŸ”— 지식 μ—°κ²° (Graph) - Related: AlphaGo (Monte Carlo Tree Search + RL) , Reinforcement Learning - Foundation: Computational Thinking