--- id: ML-MNB-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [machine-learning, nlp, naive-bayes, text-classification, statistics, bayesian] last_reinforced: 2026-04-26 --- # Multinomial Naive Bayes (λ‹€ν•­ λ‚˜μ΄λΈŒ 베이즈) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "λ‹¨μ–΄μ˜ λΉˆλ„ 속에 μˆ¨κ²¨μ§„ ν™•λ₯ μ˜ νž˜μ„ λ―Ώκ³ , λ³΅μž‘ν•œ λ¬Έλ§₯ λŒ€μ‹  톡계적 μ •μ§ν•¨μœΌλ‘œ λ¬Έμ„œλ₯Ό λΆ„λ₯˜ν•˜λΌ" β€” 각 νŠΉμ§•(단어 λΉˆλ„)이 λ‹€ν•­ 뢄포λ₯Ό λ”°λ₯Έλ‹€κ³  κ°€μ •ν•˜κ³ , 베이즈 정리λ₯Ό ν™œμš©ν•˜μ—¬ λ¬Έμ„œμ˜ μΉ΄ν…Œκ³ λ¦¬λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” ν…μŠ€νŠΈ λ§ˆμ΄λ‹μ˜ 고전적 베이슀라인 μ•Œκ³ λ¦¬μ¦˜. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Word Frequency Likelihood" β€” λ¬Έμž₯을 λ‹¨μˆœνžˆ λ‹¨μ–΄μ˜ λ­‰μΉ˜(Bag-of-Words)둜 보고, νŠΉμ • ν΄λž˜μŠ€μ—μ„œ ν•΄λ‹Ή 단어듀이 λ‚˜νƒ€λ‚  쑰건뢀 ν™•λ₯ μ„ κ²°ν•©ν•˜μ—¬ κ°€μž₯ 높은 사후 ν™•λ₯ μ„ κ°€μ§„ 클래슀λ₯Ό μ„ νƒν•˜λŠ” νŒ¨ν„΄. - **μ£Όμš” νŠΉμ§•:** - **Efficiency:** μ—°μ‚°λŸ‰μ΄ 맀우 적어 λŒ€κ·œλͺ¨ ν…μŠ€νŠΈ 데이터λ₯Ό μˆœμ‹κ°„μ— 처리 κ°€λŠ₯. - **Robustness to Small Data:** 데이터가 적을 λ•Œλ„ λ‚˜μ΄λΈŒ 베이즈 특유의 'κ°•ν•œ κ°€μ •' 덕뢄에 비ꡐ적 μ•ˆμ •μ μΈ μ„±λŠ₯ 발휘. - **Laplace Smoothing:** ν•œ λ²ˆλ„ λ‚˜μ˜€μ§€ μ•Šμ€ 단어 λ•Œλ¬Έμ— ν™•λ₯ μ΄ 0이 λ˜λŠ” ν˜„μƒμ„ λ°©μ§€ν•˜λŠ” ν•„μˆ˜ 기법 적용. - **의의:** λ”₯λŸ¬λ‹ μ‹œλŒ€ μ΄μ „κΉŒμ§€ 슀팸 필터링, λ‰΄μŠ€ λΆ„λ₯˜ λ“± ν…μŠ€νŠΈ 처리의 ν‘œμ€€μ΄μ—ˆμœΌλ©°, ν˜„μž¬λ„ λ³΅μž‘ν•œ λͺ¨λΈμ„ 돌리기 μ „ μ„±λŠ₯의 기쀀점(Baseline)으둜 널리 ν™œμš©λ¨. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** 단어 κ°„μ˜ 독립성을 κ°€μ •(Naive)ν•˜κΈ° λ•Œλ¬Έμ— λ¬Έλ§₯μ΄λ‚˜ 단어 μˆœμ„œλ₯Ό λ¬΄μ‹œν•œλ‹€λŠ” 치λͺ…적 단점이 μžˆμœΌλ‚˜, μ‹€μ œ ν…μŠ€νŠΈ λΆ„λ₯˜ ν™˜κ²½μ—μ„œλŠ” 이 λ‹¨μˆœν•¨μ΄ 였히렀 κ°•λ ₯ν•œ μΌλ°˜ν™” μ„±λŠ₯을 μ œκ³΅ν•˜λŠ” 'λ‚˜μ΄λΈŒ 베이즈의 μ—­μ„€'이 μ’…μ’… λ°œμƒν•¨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” μˆ˜μ§‘λœ μ›μ‹œ 데이터(Raw Data)λ₯Ό 1차적으둜 λΉ λ₯΄κ²Œ μΉ΄ν…Œκ³ λ¦¬ν™”ν•˜κ±°λ‚˜, ν‚€μ›Œλ“œ 기반의 μ˜λ„ λΆ„λ₯˜λ₯Ό μˆ˜ν–‰ν•  λ•Œ λΉ„μš© λŒ€λΉ„ 효율이 κ·ΉλŒ€ν™”λœ λ‹€ν•­ λ‚˜μ΄λΈŒ 베이즈 λͺ¨λΈμ„ ν™œμš©ν•¨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Naive-Bayes-Classifiers]], NLP-Foundations, Probability-Theory, [[Supervised-Learning-Foundations]] - **Raw Source:** 10_Wiki/Topics/AI/Multinomial-Naive-Bayes.md