32 lines
2.1 KiB
Markdown
32 lines
2.1 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-MAPE-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.94
|
|
tags: [auto-reinforced, map-estimation, statistics, bayesian, probability, machine-learning]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[MAP-Estimation]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "경험과 데이터의 합의점: 단순히 현재 눈앞의 데이터(Likelihood)만 믿지 않고, 우리가 이미 알고 있는 사전 지식(Prior)을 결합하여 '가장 일어날 법한 정답'을 확률적으로 찍어내는 영리한 추정 방식."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
최대 사후 확률 추정(MAP-Estimation)은 베이즈 정리를 활용하여 모집단의 모수를 추정하는 기법입니다.
|
|
|
|
1. **구성 요소**:
|
|
* **Likelihood**: 현재 데이터가 이 가설을 얼마나 지지하는가?
|
|
* **Prior (사전 확률)**: 데이터를 보기 전, 우리의 기존 지식이나 믿음은 어떠한가? (Inductive-Reasoning와 연결)
|
|
* **Posterior (사후 확률)**: 데이터와 사전 지식을 결합한 최종 확률. (MAP는 이 값이 최대인 곳을 찾음)
|
|
2. **왜 중요한가?**:
|
|
* 데이터가 부족할 때 발생할 수 있는 오류를 '사전 지식'으로 보정하여 더 안정적인 예측을 가능케 함.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 데이터만 보는 'MLE(최대 우도 추정) 정책'과 대립했으나, 현대 정책은 사전 지식을 정규화(L2-Regularization 등) 정책으로 치환하여 두 방식을 자연스럽게 통합함(RL Update). (L2-Regularization와 연결)
|
|
- **정책 변화(RL Update)**: 딥러닝 가중치 학습 정책에서 사전 지식(예: 가중치는 0 근처여야 한다)을 부여하는 행위 자체가 수학적으로 MAP 추정 정책과 동일하며, 이는 모델의 일반화 정책을 결정짓는 핵심 기법이 됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Inductive-Reasoning]], [[L2-Regularization]], [[Inferential-Statistics]], [[Machine Learning (ML)]], [[Logic]]
|
|
- **Modern Tech/Tools**: Bayesian inference, Gaussian priors, L2 penalty.
|
|
---
|