docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -1,12 +1,12 @@
|
||||
---
|
||||
id: [[P-Reinforce]]-AUTO-PRIS-001
|
||||
id: [[P-Reinforce|P-Reinforce]]-AUTO-PRIS-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.97
|
||||
tags: [auto-reinforced, [[Game-Theory]], nash-equilibrium, co[[Opera]]tion, rational-choice]
|
||||
tags: [auto-reinforced, [[Game-Theory|Game-Theory]], nash-equilibrium, co[[Opera|Opera]]tion, rational-choice]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Prisoners-Dilemma-Models]]
|
||||
# [[Prisoners-Dilemma-Models|Prisoners-Dilemma-Models]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "각자에게 최선이 모두에게는 최악이 되는 비극: 개인의 합리적 선택이 집단의 파멸을 부르는 사회적 딜레마를 수학적으로 모델링한 게임 이론의 걸작."
|
||||
@@ -21,7 +21,7 @@ last_reinforced: 2026-04-20
|
||||
* 모두 배신할 때(P): 둘 다 손해 (보통 R보다 나쁘고 S보다 좋음).
|
||||
* **조건**: $T > R > P > S$ 및 $2R > T + S$
|
||||
2. **핵심 개념**:
|
||||
* **우월 전략 (Dominant [[Strategy]])**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
|
||||
* **우월 전략 (Dominant [[Strategy|Strategy]])**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
|
||||
* **내시 균형 (Nash Equilibrium)**: 둘 다 '배신'을 선택한 상태. 이 상태에서는 누구도 혼자 전략을 바꿔서 이득을 볼 수 없음.
|
||||
* **Social Dilemma**: 내시 균형인 (P, P)는 Pareto 최적인 (R, R)보다 사회 전체적으로 손해임.
|
||||
3. **반복된 죄수의 딜레마 (Iterated PD)**:
|
||||
@@ -33,6 +33,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: 기후 위기 대응(탄소 배출 제한)과 같은 글로벌 공조 실패 문제를 죄수의 딜레마 모델로 분석하여, 무임승차를 방지하고 강제적 협력을 유도하는 탄소 국경세와 같은 보복 정책 도입의 근거가 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Game Theory, [[Decision Theory]], [[Ethics & AI]], [[Social[[ system]]s Theory]], Economic Models
|
||||
- Game Theory, [[Decision Theory|Decision Theory]], [[Ethics & AI|Ethics & AI]], Social[[Systems Theory|systems Theory]], Economic Models
|
||||
- **Modern Tech/Tools**: Axelrod's Tournament, Evolutionary Stable Strategy (ESS).
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user