--- id: wiki-2026-0508-language-models title: Language Models category: 10_Wiki/Topics status: needs_review canonical_id: self aliases: [P-Reinforce-AUTO-LAMO-001] duplicate_of: none source_trust_level: A confidence_score: 0.98 tags: [auto-reinforced, language-models, nlp, probability, word-prediction, linguistic-modeling] raw_sources: [] last_reinforced: 2026-04-20 github_commit: pending inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08) tech_stack: language: unspecified framework: unspecified --- # [[Language-Models|Language-Models]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "λ‹¨μ–΄μ˜ ν™•λ₯  지도: 이전에 λ‚˜μ˜¨ 단어 μ‹œν€€μŠ€λ₯Ό 보고 λ‹€μŒμ— μ–΄λ–€ 단어가 올 ν™•λ₯ μ΄ κ°€μž₯ 높은지 κ³„μ‚°ν•˜μ—¬, 기계가 μΈκ°„μ˜ μ–Έμ–΄λ₯Ό μƒμ„±ν•˜κ±°λ‚˜ μ΄ν•΄ν•˜κ²Œ λ§Œλ“œλŠ” μˆ˜ν•™μ  μ–Έμ–΄ μ²΄κ³„μ˜ μ›ν˜•." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) μ–Έμ–΄ λͺ¨λΈ(Language-Models)은 ν…μŠ€νŠΈ λ°μ΄ν„°μ˜ ν™•λ₯  뢄포λ₯Ό ν•™μŠ΅ν•˜λŠ” λͺ¨λΈμž…λ‹ˆλ‹€. 1. **μž‘λ™ λ©”μ»€λ‹ˆμ¦˜**: * **Next Token Prediction**: "고양이가 앉아..." λ‹€μŒμ— "μžˆλ‹€" ν˜Ήμ€ "μž”λ‹€"κ°€ 올 ν™•λ₯ μ„ 계산. * **Language Understanding**: 문법, λ¬Έλ§₯, 사싀 정보λ₯Ό 이 ν™•λ₯ μ  νŒ¨ν„΄ 속에 녹여냄. 2. **μ—­μ‚¬μ˜ 흐름**: * N-gram (톡계) -> RNN/[[LSTM|LSTM]] (순차 신경망) -> Transformer (병렬 Attention). (Transformer (트랜슀포머)와 μ—°κ²°) 3. **μ™œ μ€‘μš”ν•œκ°€?**: * 인곡지λŠ₯이 'μ–Έμ–΄'λΌλŠ” 인간 고유의 μΈν„°νŽ˜μ΄μŠ€λ₯Ό νšλ“ν•˜κ²Œ ν•œ 결정적 도ꡬ이기 λ•Œλ¬Έμž„. ([[HCI (Human-Computer Interaction)|HCI (Human-Computer Interaction)]]와 μ—°κ²°) ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & Updates) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±° μ–Έμ–΄ λͺ¨λΈ 정책은 λ‹¨μˆœ μžλ™ μ™„μ„± μ •μ±… μˆ˜μ€€μ΄μ—ˆμœΌλ‚˜, ν˜„λŒ€ λͺ¨λΈ 정책은 μ–Έμ–΄ 속에 λ‹΄κΈ΄ '상식과 물리 μ„Έκ³„μ˜ 인과성 μ •μ±…'κΉŒμ§€ λΆ€λΆ„μ μœΌλ‘œ ν•™μŠ΅ν•˜λŠ” λ‹¨κ³„λ‘œ μ§„μž…ν•¨(RL Update). - **μ •μ±… λ³€ν™”(RL Update)**: λ‹¨μˆœνžˆ ν…μŠ€νŠΈλ§Œ ν•™μŠ΅ν•˜λŠ” 정책을 λ„˜μ–΄, μ‹œκ°, 청각 정보λ₯Ό μ–Έμ–΄μ˜ 문법 μ •μ±…μœΌλ‘œ 톡합 ν•™μŠ΅ν•˜λŠ” 'λ©€ν‹°λͺ¨λ‹¬ μ–Έμ–΄ λͺ¨λΈ μ •μ±…'으둜 νŒ¨λŸ¬λ‹€μž„μ΄ ν™•μž₯됨. ([[Foundation-Models|Foundation-Models]]와 μ—°κ²°) ## πŸ”— 지식 μ—°κ²° (Graph) - [[Large Language Models (LLM)|Large Language Models (LLM)]], Transformer (트랜슀포머), [[HCI (Human-Computer Interaction)|HCI (Human-Computer Interaction)]], [[Foundation-Models|Foundation-Models]], Deep Learning (DL) - **Modern Tech/Tools**: [[BERT|BERT]], Word2Vec, GloVe, GPT series, Tokenizers. --- ## πŸ€– LLM ν™œμš© 힌트 (How to Use This Knowledge) **μ–Έμ œ 이 지식을 μ“°λŠ”κ°€:** - *(TODO)* **μ–Έμ œ μ“°λ©΄ μ•ˆ λ˜λŠ”κ°€:** - *(TODO)* ## πŸ§ͺ 검증 μƒνƒœ (Validation) - **정보 μƒνƒœ:** needs_review - **좜처 신뒰도:** A - **κ²€ν†  이유:** *(P-Reinforce Phase 1 μžλ™ μ •κ·œν™”. λ³Έλ¬Έ 검증 ν•„μš”.)* ## 🧬 쀑볡 검사 (Duplicate Check) - **κΈ°μ‘΄ μœ μ‚¬ λ¬Έμ„œ:** *(TODO: μΈλ±μ„œ ν΄λŸ¬μŠ€ν„° 리포트 μ°Έμ‘°)* - **처리 방식:** UPDATE (μžλ™ μ •κ·œν™”) - **처리 이유:** Phase 1 μ •κ·œν™” β€” μ˜› ν…œν”Œλ¦Ώ/λˆ„λ½ ν•„λ“œ 보강. ## πŸ•“ λ³€κ²½ 이λ ₯ (Changelog) | λ‚ μ§œ | λ³€κ²½ λ‚΄μš© | 처리 방식 | 신뒰도 | |------|-----------|-----------|--------| | 2026-05-08 | P-Reinforce Phase 1 μ •κ·œν™” (frontmatter + 헀더 ν‘œμ€€ν™”) | UPDATE | A | ## πŸ’» μ½”λ“œ νŒ¨ν„΄ (Code Patterns) **νŒ¨ν„΄ 1:** *(TODO: 이 ν”„λ‘œμ νŠΈ μ»¨λ²€μ…˜ λ°˜μ˜ν•œ ꡬ쑰 μŠ€μΌˆλ ˆν†€)* ```text # TODO ``` ## πŸ€” μ˜μ‚¬κ²°μ • κΈ°μ€€ (Decision Criteria) **선택 Aλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **선택 Bλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **κΈ°λ³Έκ°’:** > *(TODO)* ## ❌ μ•ˆν‹°νŒ¨ν„΄ (Anti-Patterns) - **[μ•ˆν‹°νŒ¨ν„΄]:** *(TODO: 무엇을 ν•˜λ©΄ μ•ˆ λ˜λŠ”κ°€ + 이유 + λŒ€μ‹  무엇을)*