[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+5 -5
View File
@@ -1,8 +1,8 @@
---
id: P-REINFORCE-AUTO-MAPE-001
id: [[P-Reinforce]]-AUTO-MAPE-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.94
tags: [auto-reinforced, map-estimation, statistics, bayesian, probability, machine-learning]
tags: [auto-reinforced, map-estimation, [[Statistics]], bayesian, probability, machine-learning]
last_reinforced: 2026-04-20
---
@@ -16,16 +16,16 @@ last_reinforced: 2026-04-20
1. **구성 요소**:
* **Likelihood**: 현재 데이터가 이 가설을 얼마나 지지하는가?
* **Prior (사전 확률)**: 데이터를 보기 전, 우리의 기존 지식이나 믿음은 어떠한가? (Inductive-Reasoning와 연결)
* **Prior (사전 확률)**: 데이터를 보기 전, 우리의 기존 지식이나 믿음은 어떠한가? ([[Inductive-Reasoning]]와 연결)
* **Posterior (사후 확률)**: 데이터와 사전 지식을 결합한 최종 확률. (MAP는 이 값이 최대인 곳을 찾음)
2. **왜 중요한가?**:
* 데이터가 부족할 때 발생할 수 있는 오류를 '사전 지식'으로 보정하여 더 안정적인 예측을 가능케 함.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 데이터만 보는 'MLE(최대 우도 추정) 정책'과 대립했으나, 현대 정책은 사전 지식을 정규화(L2-Regularization 등) 정책으로 치환하여 두 방식을 자연스럽게 통합함(RL Update). (L2-Regularization와 연결)
- **과거 데이터와의 충돌**: 과거에는 데이터만 보는 'MLE(최대 우도 추정) 정책'과 대립했으나, 현대 정책은 사전 지식을 정규화([[L2-Regularization]] 등) 정책으로 치환하여 두 방식을 자연스럽게 통합함(RL Update). (L2-[[Regularization]]와 연결)
- **정책 변화(RL Update)**: 딥러닝 가중치 학습 정책에서 사전 지식(예: 가중치는 0 근처여야 한다)을 부여하는 행위 자체가 수학적으로 MAP 추정 정책과 동일하며, 이는 모델의 일반화 정책을 결정짓는 핵심 기법이 됨.
## 🔗 지식 연결 (Graph)
- [[Inductive-Reasoning]], [[L2-Regularization]], [[Inferential-Statistics]], [[Machine Learning (ML)]], [[Logic]]
- **Modern Tech/Tools**: Bayesian inference, Gaussian priors, L2 penalty.
- **Modern Tech/Tools**: [[Bayesian Inference]], Gaussian priors, L2 penalty.
---