[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-PRIS-001
|
||||
id: [[P-Reinforce]]-AUTO-PRIS-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.97
|
||||
tags: [auto-reinforced, game-theory, nash-equilibrium, cooperation, rational-choice]
|
||||
tags: [auto-reinforced, [[Game-Theory]], nash-equilibrium, co[[Opera]]tion, rational-choice]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
@@ -21,7 +21,7 @@ last_reinforced: 2026-04-20
|
||||
* 모두 배신할 때(P): 둘 다 손해 (보통 R보다 나쁘고 S보다 좋음).
|
||||
* **조건**: $T > R > P > S$ 및 $2R > T + S$
|
||||
2. **핵심 개념**:
|
||||
* **우월 전략 (Dominant Strategy)**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
|
||||
* **우월 전략 (Dominant [[Strategy]])**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
|
||||
* **내시 균형 (Nash Equilibrium)**: 둘 다 '배신'을 선택한 상태. 이 상태에서는 누구도 혼자 전략을 바꿔서 이득을 볼 수 없음.
|
||||
* **Social Dilemma**: 내시 균형인 (P, P)는 Pareto 최적인 (R, R)보다 사회 전체적으로 손해임.
|
||||
3. **반복된 죄수의 딜레마 (Iterated PD)**:
|
||||
@@ -33,6 +33,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: 기후 위기 대응(탄소 배출 제한)과 같은 글로벌 공조 실패 문제를 죄수의 딜레마 모델로 분석하여, 무임승차를 방지하고 강제적 협력을 유도하는 탄소 국경세와 같은 보복 정책 도입의 근거가 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Game Theory, [[Decision Theory]], [[Ethics & AI]], [[Social Systems Theory]], Economic Models
|
||||
- Game Theory, [[Decision Theory]], [[Ethics & AI]], [[Social[[ system]]s Theory]], Economic Models
|
||||
- **Modern Tech/Tools**: Axelrod's Tournament, Evolutionary Stable Strategy (ESS).
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user