--- id: DL-LOSS-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [ai, deep-learning, loss-function, cost-function, optimization, neural-networks] last_reinforced: 2026-04-26 --- # Loss Functions Foundations (손싀 ν•¨μˆ˜ 기초) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "λͺ¨λΈμ˜ μ‹€μˆ˜(Error)λ₯Ό λΌˆμ•„ν”ˆ 수치둜 ν™˜μ‚°ν•˜μ—¬, 정닡을 ν–₯ν•œ κ°€μž₯ κ°€νŒŒλ₯Έ 길을 κ°€λ¦¬ν‚€λŠ” λ‚˜μΉ¨λ°˜μœΌλ‘œ 삼아라" β€” λͺ¨λΈμ˜ μ˜ˆμΈ‘κ°’κ³Ό μ‹€μ œ μ •λ‹΅ μ‚¬μ΄μ˜ 차이λ₯Ό ν•˜λ‚˜μ˜ 슀칼라 κ°’μœΌλ‘œ μ •μ˜ν•˜μ—¬, 경사 ν•˜κ°•λ²•(Gradient Descent)이 μ΅œμ†Œκ°’μ„ ν–₯ν•΄ λ‚˜μ•„κ°ˆ 수 μžˆλ„λ‘ ν•™μŠ΅μ˜ λ°©ν–₯을 κ²°μ •ν•˜λŠ” 핡심 μ§€ν‘œ. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Differentiable Error Mapping" β€” λΆˆμ—°μ†μ μΈ '맞고 ν‹€λ¦Ό'을 λ―ΈλΆ„ κ°€λŠ₯ν•œ 연속적인 ν•¨μˆ˜λ‘œ λ³€ν™˜ν•˜μ—¬, μ˜€μ°¨κ°€ 클수둝 더 κ°•ν•œ ν”Όλ“œλ°±(Gradient)을 κ°€μ€‘μΉ˜μ— μ „λ‹¬ν•¨μœΌλ‘œμ¨ λͺ¨λΈμ„ 슀슀둜 μˆ˜μ •ν•˜κ²Œ λ§Œλ“œλŠ” μ΅œμ ν™” μ§€ν‘œ νŒ¨ν„΄. - **μ£Όμš” 손싀 ν•¨μˆ˜:** - **MSE (Mean Squared Error):** 예츑 였차의 제곱 평균. νšŒκ·€ 문제의 ν‘œμ€€. 큰 μ˜€μ°¨μ— 민감함. - **Cross-Entropy Loss:** ν™•λ₯  뢄포 κ°„μ˜ 차이 μΈ‘μ •. λΆ„λ₯˜ 문제의 ν‘œμ€€. μ •λ‹΅μ—μ„œ λ©€μ–΄μ§ˆμˆ˜λ‘ νŽ˜λ„ν‹°κ°€ κΈ°ν•˜κΈ‰μˆ˜μ μœΌλ‘œ 증가. - **Hinge Loss:** μ„œν¬νŠΈ 벑터 λ¨Έμ‹ (SVM)μ—μ„œ μ‚¬μš©. 경계선(Margin)을 μ§€ν‚€μ§€ λͺ»ν•  λ•Œ 벌점 λΆ€μ—¬. - **의의:** 손싀 ν•¨μˆ˜μ˜ 섀계가 κ³§ λͺ¨λΈμ˜ 'λͺ©ν‘œ'λ₯Ό μ„€μ •ν•˜λŠ” ν–‰μœ„μ΄λ©°, 문제의 본질(λΆ„λ₯˜, νšŒκ·€, 생성 λ“±)에 λ§žλŠ” μ μ ˆν•œ ν•¨μˆ˜ 선택이 μ„±λŠ₯의 80%λ₯Ό 결정함. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** λ‹¨μˆœνžˆ 였차λ₯Ό μ€„μ΄λŠ” κ²ƒμ—μ„œ λ²—μ–΄λ‚˜, μ΅œκ·Όμ—λŠ” ν•™μŠ΅μ˜ μ•ˆμ •μ„±μ„ μœ„ν•΄ Focal Loss(λΆˆκ· ν˜• 데이터)λ‚˜ μ •κ·œν™” 항이 ν¬ν•¨λœ 볡합 손싀 ν•¨μˆ˜λ₯Ό μ„€κ³„ν•˜μ—¬ λͺ¨λΈμ˜ μΌλ°˜ν™” λŠ₯λ ₯을 μ •κ΅ν•˜κ²Œ μ œμ–΄ν•¨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” μ—μ΄μ „νŠΈμ˜ 지식 κ°•ν™” μž‘μ—… ν’ˆμ§ˆμ„ 평가할 λ•Œ, λ‹¨μˆœ μ •λ‹΅λ₯  외에도 코사인 μœ μ‚¬λ„μ™€ 정보 μ—”νŠΈλ‘œν”Όλ₯Ό κ²°ν•©ν•œ μ»€μŠ€ν…€ 손싀 μ§€ν‘œλ₯Ό ν™œμš©ν•˜μ—¬ μ§€μ‹μ˜ 밀도λ₯Ό 관리함. ## πŸ”— 지식 μ—°κ²° (Graph) - Gradient-Descent-Foundations, Backpropagation-Foundations, [[Focal-Loss|Focal-Loss]], [[Kullback-Leibler-Divergence|Kullback-Leibler-Divergence]] - **Raw Source:** 10_Wiki/Topics/AI/Loss-Functions-Foundations.md