[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+4 -4
View File
@@ -1,8 +1,8 @@
---
id: P-REINFORCE-AUTO-PRIS-001
id: [[P-Reinforce]]-AUTO-PRIS-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.97
tags: [auto-reinforced, game-theory, nash-equilibrium, cooperation, rational-choice]
tags: [auto-reinforced, [[Game-Theory]], nash-equilibrium, co[[Opera]]tion, rational-choice]
last_reinforced: 2026-04-20
---
@@ -21,7 +21,7 @@ last_reinforced: 2026-04-20
* 모두 배신할 때(P): 둘 다 손해 (보통 R보다 나쁘고 S보다 좋음).
* **조건**: $T > R > P > S$ 및 $2R > T + S$
2. **핵심 개념**:
* **우월 전략 (Dominant Strategy)**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
* **우월 전략 (Dominant [[Strategy]])**: 상대가 무엇을 하든 나는 '배신'하는 것이 유리함.
* **내시 균형 (Nash Equilibrium)**: 둘 다 '배신'을 선택한 상태. 이 상태에서는 누구도 혼자 전략을 바꿔서 이득을 볼 수 없음.
* **Social Dilemma**: 내시 균형인 (P, P)는 Pareto 최적인 (R, R)보다 사회 전체적으로 손해임.
3. **반복된 죄수의 딜레마 (Iterated PD)**:
@@ -33,6 +33,6 @@ last_reinforced: 2026-04-20
- **정책 변화(RL Update)**: 기후 위기 대응(탄소 배출 제한)과 같은 글로벌 공조 실패 문제를 죄수의 딜레마 모델로 분석하여, 무임승차를 방지하고 강제적 협력을 유도하는 탄소 국경세와 같은 보복 정책 도입의 근거가 됨.
## 🔗 지식 연결 (Graph)
- Game Theory, [[Decision Theory]], [[Ethics & AI]], [[Social Systems Theory]], Economic Models
- Game Theory, [[Decision Theory]], [[Ethics & AI]], [[Social[[ system]]s Theory]], Economic Models
- **Modern Tech/Tools**: Axelrod's Tournament, Evolutionary Stable Strategy (ESS).
---