1.5 KiB
1.5 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | |||||
|---|---|---|---|---|---|---|---|---|---|
| P-REINFORCE-AI-CGT | 10_Wiki/💡 Topics/AI | 0.99 |
|
2026-04-20 |
Combinatorial-Game-Theory (조합론적 게임 이론 CGT)
📌 한 줄 통찰 (The Karpathy Summary)
우연도 숨겨진 정보도 없는 '완전 정보 게임'에서, 수학적으로 필승 전략(Winning Strategy)이 반드시 존재함을 증명하고 찾아내는 지적 유희다.
📖 구조화된 지식 (Synthesized Content)
- Perfect Information Games:
- 체스, 바둑, 님(Nim) 게임처럼 모든 정보가 공개되어 있고 주사위 같은 확률 요소가 없는 게임.
- Game Tree Search:
- 모든 가능한 수의 경로를 트리 구조로 나타내고, 리프 노드(결과)에서부터 위로 거슬러 올라가며 최선의 수를 찾는 방식.
- Normal Play Convention:
- "마지막 수를 두는 사람이 이긴다"는 규칙 하의 전략 분석. 게임을 숫자(Value)로 치환하여 복잡한 게임을 더 단순한 게임의 합으로 분해한다.
⚠️ 모순 및 업데이트 (RL Update)
- 바둑처럼 경우의 수가 우주 원자 수보다 많은 경우, 고전적인 CGT만으로는 해결이 불가능하다. 이때 알파고처럼 딥러닝과 몬테카를로 트리 탐색(MCTS)을 결합하여 '근사적 필승 전략'을 찾는 방식으로 현대적 진화가 일어났다.
🔗 지식 연결 (Graph)
- Related: AlphaGo (Monte Carlo Tree Search + RL) , Reinforcement Learning
- Foundation: Computational Thinking