--- id: wiki-2026-0508-map-estimation title: MAP Estimation category: 10_Wiki/Topics status: needs_review canonical_id: self aliases: [P-Reinforce-AUTO-MAPE-001] duplicate_of: none source_trust_level: A confidence_score: 0.94 tags: [auto-reinforced, map-estimation, Statistics, bayesian, probability, machine-learning] raw_sources: [] last_reinforced: 2026-04-20 github_commit: pending inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08) --- # [[MAP-Estimation|MAP-Estimation]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "κ²½ν—˜κ³Ό λ°μ΄ν„°μ˜ ν•©μ˜μ : λ‹¨μˆœνžˆ ν˜„μž¬ λˆˆμ•žμ˜ 데이터(Likelihood)만 λ―Ώμ§€ μ•Šκ³ , μš°λ¦¬κ°€ 이미 μ•Œκ³  μžˆλŠ” 사전 지식(Prior)을 κ²°ν•©ν•˜μ—¬ 'κ°€μž₯ 일어날 λ²•ν•œ μ •λ‹΅'을 ν™•λ₯ μ μœΌλ‘œ μ°μ–΄λ‚΄λŠ” μ˜λ¦¬ν•œ μΆ”μ • 방식." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) μ΅œλŒ€ 사후 ν™•λ₯  μΆ”μ •(MAP-Estimation)은 베이즈 정리λ₯Ό ν™œμš©ν•˜μ—¬ λͺ¨μ§‘λ‹¨μ˜ λͺ¨μˆ˜λ₯Ό μΆ”μ •ν•˜λŠ” κΈ°λ²•μž…λ‹ˆλ‹€. 1. **ꡬ성 μš”μ†Œ**: * **Likelihood**: ν˜„μž¬ 데이터가 이 가섀을 μ–Όλ§ˆλ‚˜ μ§€μ§€ν•˜λŠ”κ°€? * **Prior (사전 ν™•λ₯ )**: 데이터λ₯Ό 보기 μ „, 우리의 κΈ°μ‘΄ μ§€μ‹μ΄λ‚˜ λ―ΏμŒμ€ μ–΄λ– ν•œκ°€? ([[Inductive-Reasoning|Inductive-Reasoning]]와 μ—°κ²°) * **Posterior (사후 ν™•λ₯ )**: 데이터와 사전 지식을 κ²°ν•©ν•œ μ΅œμ’… ν™•λ₯ . (MAPλŠ” 이 값이 μ΅œλŒ€μΈ 곳을 찾음) 2. **μ™œ μ€‘μš”ν•œκ°€?**: * 데이터가 λΆ€μ‘±ν•  λ•Œ λ°œμƒν•  수 μžˆλŠ” 였λ₯˜λ₯Ό '사전 지식'으둜 λ³΄μ •ν•˜μ—¬ 더 μ•ˆμ •μ μΈ μ˜ˆμΈ‘μ„ κ°€λŠ₯μΌ€ 함. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & Updates) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±°μ—λŠ” λ°μ΄ν„°λ§Œ λ³΄λŠ” 'MLE(μ΅œλŒ€ μš°λ„ μΆ”μ •) μ •μ±…'κ³Ό λŒ€λ¦½ν–ˆμœΌλ‚˜, ν˜„λŒ€ 정책은 사전 지식을 μ •κ·œν™”([[L2-Regularization|L2-Regularization]] λ“±) μ •μ±…μœΌλ‘œ μΉ˜ν™˜ν•˜μ—¬ 두 방식을 μžμ—°μŠ€λŸ½κ²Œ 톡합함(RL Update). (L2-[[Regularization|Regularization]]와 μ—°κ²°) - **μ •μ±… λ³€ν™”(RL Update)**: λ”₯λŸ¬λ‹ κ°€μ€‘μΉ˜ ν•™μŠ΅ μ •μ±…μ—μ„œ 사전 지식(예: κ°€μ€‘μΉ˜λŠ” 0 κ·Όμ²˜μ—¬μ•Ό ν•œλ‹€)을 λΆ€μ—¬ν•˜λŠ” ν–‰μœ„ μžμ²΄κ°€ μˆ˜ν•™μ μœΌλ‘œ MAP μΆ”μ • μ •μ±…κ³Ό λ™μΌν•˜λ©°, μ΄λŠ” λͺ¨λΈμ˜ μΌλ°˜ν™” 정책을 κ²°μ •μ§“λŠ” 핡심 기법이 됨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Inductive-Reasoning|Inductive-Reasoning]], [[L2-Regularization|L2-Regularization]], [[Inferential-Statistics|Inferential-Statistics]], [[Machine Learning (ML)|Machine Learning (ML)]], [[Logic|Logic]] - **Modern Tech/Tools**: [[Bayesian Inference|Bayesian Inference]], Gaussian priors, L2 penalty. --- ## πŸ€– LLM ν™œμš© 힌트 (How to Use This Knowledge) **μ–Έμ œ 이 지식을 μ“°λŠ”κ°€:** - *(TODO)* **μ–Έμ œ μ“°λ©΄ μ•ˆ λ˜λŠ”κ°€:** - *(TODO)* ## πŸ§ͺ 검증 μƒνƒœ (Validation) - **정보 μƒνƒœ:** needs_review - **좜처 신뒰도:** A - **κ²€ν†  이유:** *(P-Reinforce Phase 1 μžλ™ μ •κ·œν™”. λ³Έλ¬Έ 검증 ν•„μš”.)* ## 🧬 쀑볡 검사 (Duplicate Check) - **κΈ°μ‘΄ μœ μ‚¬ λ¬Έμ„œ:** *(TODO: μΈλ±μ„œ ν΄λŸ¬μŠ€ν„° 리포트 μ°Έμ‘°)* - **처리 방식:** UPDATE (μžλ™ μ •κ·œν™”) - **처리 이유:** Phase 1 μ •κ·œν™” β€” μ˜› ν…œν”Œλ¦Ώ/λˆ„λ½ ν•„λ“œ 보강. ## πŸ•“ λ³€κ²½ 이λ ₯ (Changelog) | λ‚ μ§œ | λ³€κ²½ λ‚΄μš© | 처리 방식 | 신뒰도 | |------|-----------|-----------|--------| | 2026-05-08 | P-Reinforce Phase 1 μ •κ·œν™” (frontmatter + 헀더 ν‘œμ€€ν™”) | UPDATE | A |