docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
@@ -1,12 +1,12 @@
 ---
-id: [[P-Reinforce]]-AUTO-PRIS-001
+id: [[P-Reinforce|P-Reinforce]]-AUTO-PRIS-001
 category: "10_Wiki/💡 Topics/AI"
 confidence_score: 0.97
-tags: [auto-reinforced, [[Game-Theory]], nash-equilibrium, co[[Opera]]tion, rational-choice]
+tags: [auto-reinforced, [[Game-Theory|Game-Theory]], nash-equilibrium, co[[Opera|Opera]]tion, rational-choice]
 last_reinforced: 2026-04-20
 ---

-# [[Prisoners-Dilemma-Models]]
+# [[Prisoners-Dilemma-Models|Prisoners-Dilemma-Models]]

 ## 📌 한 줄 통찰 (The Karpathy Summary)
 > "각자에게 최선이 모두에게는 최악이 되는 비극: 개인의 합리적 선택이 집단의 파멸을 부르는 사회적 딜레마를 수학적으로 모델링한 게임 이론의 걸작."
@@ -21,7 +21,7 @@ last_reinforced: 2026-04-20
    *   모두 배신할 때(P): 둘 다 손해 (보통 R보다 나쁘고 S보다 좋음).
    *   **조건**: $T > R > P > S$ 및 $2R > T + S$
 2.  **핵심 개념**:
-    *   **우월 전략 (Dominant [[Strategy]])**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
+    *   **우월 전략 (Dominant [[Strategy|Strategy]])**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
    *   **내시 균형 (Nash Equilibrium)**: 둘 다 '배신'을 선택한 상태. 이 상태에서는 누구도 혼자 전략을 바꿔서 이득을 볼 수 없음.
    *   **Social Dilemma**: 내시 균형인 (P, P)는 Pareto 최적인 (R, R)보다 사회 전체적으로 손해임.
 3.  **반복된 죄수의 딜레마 (Iterated PD)**:
@@ -33,6 +33,6 @@ last_reinforced: 2026-04-20
 - **정책 변화(RL Update)**: 기후 위기 대응(탄소 배출 제한)과 같은 글로벌 공조 실패 문제를 죄수의 딜레마 모델로 분석하여, 무임승차를 방지하고 강제적 협력을 유도하는 탄소 국경세와 같은 보복 정책 도입의 근거가 됨.

 ## 🔗 지식 연결 (Graph)
- Game Theory, [[Decision Theory]], [[Ethics & AI]], [[Social[[ system]]s Theory]], Economic Models
+- Game Theory, [[Decision Theory|Decision Theory]], [[Ethics & AI|Ethics & AI]], Social[[Systems Theory|systems Theory]], Economic Models
 - **Modern Tech/Tools**: Axelrod's Tournament, Evolutionary Stable Strategy (ESS).
 ---