--- id: MATH-MI-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [math, information-theory, mutual-information, entropy, machine-learning, feature-selection] last_reinforced: 2026-04-26 --- # Mutual Information (μƒν˜Έ μ •λ³΄λŸ‰) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "두 λ³€μˆ˜κ°€ κ³΅μœ ν•˜κ³  μžˆλŠ” μ •λ³΄μ˜ 양을 μΈ‘μ •ν•˜μ—¬, ν•˜λ‚˜λ₯Ό μ•Œ λ•Œ λ‹€λ₯Έ ν•˜λ‚˜μ— λŒ€ν•œ λΆˆν™•μ‹€μ„±μ΄ μ–Όλ§ˆλ‚˜ μ‚¬λΌμ§€λŠ”μ§€ μˆ˜μΉ˜ν™”ν•˜λΌ" β€” 두 ν™•λ₯  λ³€μˆ˜ μ‚¬μ΄μ˜ μƒν˜Έ μ˜μ‘΄μ„±μ„ μΈ‘μ •ν•˜λŠ” μ§€ν‘œλ‘œ, λ‹¨μˆœν•œ μ„ ν˜• 관계λ₯Ό λ„˜μ–΄ λΉ„μ„ ν˜•μ μΈ μ—°κ΄€μ„±κΉŒμ§€ λͺ¨λ‘ 포착할 수 μžˆλŠ” 정보 이둠적 척도. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Uncertainty Reduction" β€” λ³€μˆ˜ $X$λ₯Ό κ΄€μ°°ν•¨μœΌλ‘œμ¨ λ³€μˆ˜ $Y$의 μ—”νŠΈλ‘œν”Ό(λΆˆν™•μ‹€μ„±)κ°€ μ–Όλ§ˆλ‚˜ κ°μ†Œν•˜λŠ”μ§€ κ³„μ‚°ν•˜μ—¬, 두 λ³€μˆ˜κ°€ μ–Όλ§ˆλ‚˜ λ°€μ ‘ν•˜κ²Œ μ–½ν˜€ μžˆλŠ”μ§€ νŒŒμ•…ν•˜λŠ” νŒ¨ν„΄. - **μˆ˜μ‹μ  μ •μ˜:** $I(X; Y) = H(X) + H(Y) - H(X, Y)$ (각자의 μ—”νŠΈλ‘œν”Ό ν•©μ—μ„œ κ²°ν•© μ—”νŠΈλ‘œν”Όλ₯Ό λΊ€ κ°’). - **μ£Όμš” νŠΉμ§•:** - **Non-linear Correlation:** μƒκ΄€κ³„μˆ˜κ°€ 0이라도 μƒν˜Έ μ •λ³΄λŸ‰μ€ 높을 수 있음 (λΉ„μ„ ν˜•μ  관계 포착 κ°€λŠ₯). - **Symmetry:** $I(X; Y) = I(Y; X)$. - **Non-negativity:** 항상 0 μ΄μƒμ˜ 값을 κ°€μ§€λ©°, 0인 경우 두 λ³€μˆ˜λŠ” λ…λ¦½μž„. - **의의:** λ¨Έμ‹ λŸ¬λ‹μ˜ νŠΉμ§• 선택(Feature Selection), 데이터 μ••μΆ•, λ² μ΄μ§€μ•ˆ λ„€νŠΈμ›Œν¬ ꡬ좕, 독립 μ„±λΆ„ 뢄석(ICA) λ“±μ—μ„œ 핡심적인 νŒλ‹¨ κΈ°μ€€μœΌλ‘œ ν™œμš©λ¨. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** μ—°μ†ν˜• λ³€μˆ˜μ—μ„œ μƒν˜Έ μ •λ³΄λŸ‰μ„ 계산할 λ•Œ ꡬ간 λΆ„ν• (Binning) 방식에 따라 값이 μ™œκ³‘λ  수 μžˆλ‹€λŠ” ν•œκ³„κ°€ μžˆμ–΄, μ΅œκ·Όμ—λŠ” KNN 기반의 KSG μΆ”μ •κΈ°λ‚˜ MINE(Mutual Information Neural Estimation) λ“± 신경망 기반 μΆ”μ • 기법이 주둜 μ‚¬μš©λ¨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” μ—μ΄μ „νŠΈμ˜ 지식 μž„λ² λ”© ν’ˆμ§ˆμ„ 평가할 λ•Œ, μž…λ ₯ ν…μŠ€νŠΈμ™€ μΆ”μΆœλœ 핡심 κ°œλ… μ‚¬μ΄μ˜ μƒν˜Έ μ •λ³΄λŸ‰μ„ μΈ‘μ •ν•˜μ—¬ 정보 손싀을 μ΅œμ†Œν™”ν•˜λŠ” μ§€ν‘œλ‘œ ν™œμš©ν•¨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Kullback-Leibler-Divergence|Kullback-Leibler-Divergence]], [[Independent-Component-Analysis|Independent-Component-Analysis]], Feature-Selection-Strategies, Probability-Theory - **Raw Source:** 10_Wiki/Topics/AI/Mutual-Information.md