chore(wiki): reinforce knowledge batch #6-#10 (200 docs milestone)

This commit is contained in:
Antigravity Agent
2026-04-26 15:07:47 +09:00
parent f541717fe1
commit c612160a13
265 changed files with 8026 additions and 1113 deletions
+17 -13
View File
@@ -1,25 +1,29 @@
---
id: P-REINFORCE-AUTO-289250
id: EUT-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Expected Utility Theory"
confidence_score: 1.0
tags: [economics, decision-theory, probability, psychology]
last_reinforced: 2026-04-26
---
# [[Expected Utility Theory]]
# [[Expected Utility Theory (기대 효용 이론)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> "불확실성 속에서 합리적인 선택을 내리는 수학적 잣대" — 각 결과의 발생 확률과 그 결과가 주는 주관적 가치(효용)를 곱하여 합산한 값이 가장 큰 선택안을 고르는 의사결정 모델.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **추출된 패턴:** 선택의 결과를 확률 변수로 보고, 기대 수익(Expected Value)이 아닌 기대 효용(Expected Utility)을 극대화하려는 합리적 행위자의 행동 패턴.
- **세부 내용:**
- **폰 노이만-모르겐슈테른 공리:** 완비성, 이행성 등 합리적 의사결정이 갖추어야 할 기본 전제 정의.
- **Risk Aversion:** 효용 함수의 오목성(Concavity)으로 인해 사람들이 왜 확실한 이득을 선호하는지 설명.
- **Utility Function:** 금액 등 객체적 수치가 아닌, 개인이 느끼는 주관적 만족도를 수치화.
- **Bernoulli's Paradox:** 왜 사람들이 기대값이 무한대인 도박에 전 재산을 걸지 않는지(한계 효용 체감)를 설명하는 근간.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
- **과거 데이터와의 충돌:** 고전 경제학의 '완전한 합리성' 전제가 실제 인간의 비합리적 선택(Allais Paradox 등)을 설명하지 못한다는 비판을 받으며 전망 이론(Prospect Theory)으로 확장됨.
- **정책 변화:** AI 에이전트의 위험 관리(Risk Management) 로직 설계 시, 단순 성공 확률뿐만 아니라 실패 시의 타격(Negative Utility)을 가중치로 두어 안정적인 의사결정을 유도함.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Expected Utility Theory.md]]
---
- **Parent:** [[10_Wiki/💡 Topics/AI]]
- **Related:** [[Decision-Theory]], [[Game-Theory]], [[Prospect-Theory]], [[Rational-Choice]]
- **Raw Source:** [[10_Wiki/Topics/AI/Expected Utility Theory.md]]