--- id: wiki-2026-0508-llm-hallucinations title: LLM Hallucinations category: 10_Wiki/Topics status: needs_review canonical_id: self aliases: [LLM-HALLUCINATION-001] duplicate_of: none source_trust_level: A confidence_score: 0.92 tags: [llm, hallucination, ai-safety, rag, grounding, fact-checking] raw_sources: [] last_reinforced: 2026-05-08 github_commit: pending inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08) tech_stack: language: unspecified framework: unspecified --- # [[LLM Hallucinations]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "ν™•λ₯ μ  λͺ½μƒ: λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈμ΄ ν•™μŠ΅ λ°μ΄ν„°μ˜ νŒ¨ν„΄μ— κΈ°λ°˜ν•΄ λ¬Έλ²•μ μœΌλ‘œ μ™„λ²½ν•˜μ§€λ§Œ μ‚¬μ‹€κ³ΌλŠ” λ‹€λ₯Έ 정보λ₯Ό μžμ‹  있게 μƒμ„±ν•˜λŠ” ν˜„μƒμœΌλ‘œ, μ‹ λ’°ν•  수 μžˆλŠ” AI μ‹œμŠ€ν…œ ꡬ좕을 μœ„ν•΄ λ°˜λ“œμ‹œ ν•΄κ²°ν•΄μ•Ό ν•  핡심 과제." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) LLM ν™˜κ°(Hallucination)은 λͺ¨λΈμ΄ ν•™μŠ΅ν•œ λ°μ΄ν„°μ˜ 톡계적 뢄포와 μ‹€μ œ 사싀 κ°„μ˜ κ΄΄λ¦¬μ—μ„œ λ°œμƒν•˜λ©°, λ‹€μ–‘ν•œ ν˜•νƒœμ™€ 원인을 κ°€μ§‘λ‹ˆλ‹€. 1. **μ£Όμš” 원인**: * **ν•™μŠ΅ λ°μ΄ν„°μ˜ ν•œκ³„**: 데이터셋에 ν¬ν•¨λœ κ±°μ§“ 정보, 편ν–₯, λ˜λŠ” νŠΉμ • μ£Όμ œμ— λŒ€ν•œ 정보 뢀쑱이 λͺ¨λΈμ˜ 잘λͺ»λœ ν•™μŠ΅μ„ μœ λ„ν•©λ‹ˆλ‹€. * **ν™•λ₯ μ  토큰 예츑**: λͺ¨λΈμ€ 본질적으둜 λ‹€μŒ 토큰을 ν™•λ₯ μ μœΌλ‘œ μ˜ˆμΈ‘ν•˜λ―€λ‘œ, 사싀 κ΄€κ³„λ³΄λ‹€λŠ” λ¬Έλ§₯적 λ§€λ„λŸ¬μ›€μ„ μš°μ„ μ‹œν•  λ•Œ ν™˜κ°μ΄ λ°œμƒν•©λ‹ˆλ‹€. * **λͺ¨λΈ μ••μΆ• 및 과적합**: λ³΅μž‘ν•œ 지식을 μœ ν•œν•œ νŒŒλΌλ―Έν„°μ— μ••μΆ•ν•˜λŠ” κ³Όμ •μ—μ„œ 정보가 μ™œκ³‘λ˜κ±°λ‚˜, νŠΉμ • νŒ¨ν„΄μ— κ³Όν•˜κ²Œ μ΅œμ ν™”λ  수 μžˆμŠ΅λ‹ˆλ‹€. 2. **ν™˜κ°μ˜ μœ ν˜•**: * **Intrinsic (λ‚΄μž¬μ )**: 제곡된 μ†ŒμŠ€ ν…μŠ€νŠΈμ™€ λͺ¨μˆœλ˜λŠ” 정보λ₯Ό μƒμ„±ν•˜λŠ” 경우. * **Extrinsic (μ™Έμž¬μ )**: μ†ŒμŠ€μ—λŠ” μ—†μ§€λ§Œ 사싀 μ—¬λΆ€λ₯Ό 확인할 수 μ—†λŠ” 정보λ₯Ό μ§€μ–΄λ‚΄λŠ” 경우. 3. **μ™„ν™” μ „λž΅ (Mitigation)**: * **RAG (Retrieval-Augmented Generation)**: μ™ΈλΆ€ 지식 베이슀(Wiki, DB)μ—μ„œ κ΄€λ ¨ λ¬Έμ„œλ₯Ό κ²€μƒ‰ν•˜μ—¬ λͺ¨λΈμ˜ 닡변을 사싀에 κ·Όκ±°(Grounding)ν•˜κ²Œ ν•©λ‹ˆλ‹€. * **Chain-of-Verification (CoVe)**: λͺ¨λΈμ΄ 슀슀둜 μƒμ„±ν•œ λ‹΅λ³€μ˜ κ°œλ³„ μ£Όμž₯을 κ²€μ¦ν•˜λŠ” μ§ˆλ¬Έμ„ λ˜μ§€κ³  μˆ˜μ •ν•˜λ„λ‘ μœ λ„ν•©λ‹ˆλ‹€. * **Self-Correction & LaaJ**: λ‹€λ₯Έ LLM을 κ²€μˆ˜μž(Judge)둜 ν™œμš©ν•˜μ—¬ λ‹΅λ³€μ˜ 사싀성을 ꡐ차 κ²€μ¦ν•©λ‹ˆλ‹€. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & Updates) * **μ°½μ˜μ„± vs 사싀성**: ν™˜κ°μ„ μ–΅μ œν•˜κΈ° μœ„ν•΄ μ œμ•½μ„ κ°•ν™”ν•˜λ©΄ λͺ¨λΈμ˜ 창의적인 λ¬Έμž₯ 생성 λŠ₯λ ₯이 μ €ν•˜λ  수 μžˆλŠ” νŠΈλ ˆμ΄λ“œμ˜€ν”„κ°€ μ‘΄μž¬ν•©λ‹ˆλ‹€. * **검증 λΉ„μš©**: μ‹€μ‹œκ°„ 검증 λ ˆμ΄μ–΄λ₯Ό μΆ”κ°€ν• μˆ˜λ‘ μΆ”λ‘  λΉ„μš©(Latency & API Cost)이 μ¦κ°€ν•©λ‹ˆλ‹€. ## πŸ”— 지식 μ—°κ²° (Graph) - **Related Topics**: [[Large Language Models (LLM)]], [[RAG (검색 증강 생성)]], [[AI Safety]], [[Knowledge-Grounding]] - **Protocols**: [[P-Reinforce]], [[Semantic Grounding & Provenance]] --- *Last updated: 2026-05-07* ## πŸ€– LLM ν™œμš© 힌트 (How to Use This Knowledge) **μ–Έμ œ 이 지식을 μ“°λŠ”κ°€:** - *(TODO)* **μ–Έμ œ μ“°λ©΄ μ•ˆ λ˜λŠ”κ°€:** - *(TODO)* ## πŸ§ͺ 검증 μƒνƒœ (Validation) - **정보 μƒνƒœ:** needs_review - **좜처 신뒰도:** A - **κ²€ν†  이유:** *(P-Reinforce Phase 1 μžλ™ μ •κ·œν™”. λ³Έλ¬Έ 검증 ν•„μš”.)* ## 🧬 쀑볡 검사 (Duplicate Check) - **κΈ°μ‘΄ μœ μ‚¬ λ¬Έμ„œ:** *(TODO: μΈλ±μ„œ ν΄λŸ¬μŠ€ν„° 리포트 μ°Έμ‘°)* - **처리 방식:** UPDATE (μžλ™ μ •κ·œν™”) - **처리 이유:** Phase 1 μ •κ·œν™” β€” μ˜› ν…œν”Œλ¦Ώ/λˆ„λ½ ν•„λ“œ 보강. ## πŸ•“ λ³€κ²½ 이λ ₯ (Changelog) | λ‚ μ§œ | λ³€κ²½ λ‚΄μš© | 처리 방식 | 신뒰도 | |------|-----------|-----------|--------| | 2026-05-08 | P-Reinforce Phase 1 μ •κ·œν™” (frontmatter + 헀더 ν‘œμ€€ν™”) | UPDATE | A | ## πŸ’» μ½”λ“œ νŒ¨ν„΄ (Code Patterns) **νŒ¨ν„΄ 1:** *(TODO: 이 ν”„λ‘œμ νŠΈ μ»¨λ²€μ…˜ λ°˜μ˜ν•œ ꡬ쑰 μŠ€μΌˆλ ˆν†€)* ```text # TODO ``` ## πŸ€” μ˜μ‚¬κ²°μ • κΈ°μ€€ (Decision Criteria) **선택 Aλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **선택 Bλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **κΈ°λ³Έκ°’:** > *(TODO)* ## ❌ μ•ˆν‹°νŒ¨ν„΄ (Anti-Patterns) - **[μ•ˆν‹°νŒ¨ν„΄]:** *(TODO: 무엇을 ν•˜λ©΄ μ•ˆ λ˜λŠ”κ°€ + 이유 + λŒ€μ‹  무엇을)*