bluemsi/2nd

Files

T

koriweb 3d9d0077cc feat: organize and categorize 1535 knowledge assets into wiki topics (2026-04-29)

2026-04-29 18:14:09 +09:00

1.5 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AI-CGT

10_Wiki/💡 Topics/AI

0.99

Game Theory

Combinatorial

Logic

Math

Strategy

2026-04-20

Combinatorial-Game-Theory (조합론적 게임 이론 CGT)

📌 한 줄 통찰 (The Karpathy Summary)

우연도 숨겨진 정보도 없는 '완전 정보 게임'에서, 수학적으로 필승 전략(Winning Strategy)이 반드시 존재함을 증명하고 찾아내는 지적 유희다.

📖 구조화된 지식 (Synthesized Content)

Perfect Information Games:
- 체스, 바둑, 님(Nim) 게임처럼 모든 정보가 공개되어 있고 주사위 같은 확률 요소가 없는 게임.
Game Tree Search:
- 모든 가능한 수의 경로를 트리 구조로 나타내고, 리프 노드(결과)에서부터 위로 거슬러 올라가며 최선의 수를 찾는 방식.
Normal Play Convention:
- "마지막 수를 두는 사람이 이긴다"는 규칙 하의 전략 분석. 게임을 숫자(Value)로 치환하여 복잡한 게임을 더 단순한 게임의 합으로 분해한다.

⚠️ 모순 및 업데이트 (RL Update)

바둑처럼 경우의 수가 우주 원자 수보다 많은 경우, 고전적인 CGT만으로는 해결이 불가능하다. 이때 알파고처럼 딥러닝과 몬테카를로 트리 탐색(MCTS)을 결합하여 '근사적 필승 전략'을 찾는 방식으로 현대적 진화가 일어났다.

🔗 지식 연결 (Graph)

Related: AlphaGo (Monte Carlo Tree Search + RL) , Reinforcement Learning
Foundation: Computational Thinking