--- id: [[P-Reinforce|P-Reinforce]]-AUTO-CWLC-001 category: Unified confidence_score: 1.00 tags: [auto-reinforced, context-window, long-context-llm, niah, ruler, infinite-context] last_reinforced: 2026-05-04 --- # [[Context Window & Long-Context LLMs|Context Window & Long-Context LLMs]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μ§€λŠ₯의 μ‹œμ•Ό: λͺ¨λΈμ΄ ν•œ λ²ˆμ— 보고 이해할 수 μžˆλŠ” μ •λ³΄μ˜ 양을 μ˜λ―Έν•˜λ©°, 수천 ν† ν°μ—μ„œ 수백만 ν† ν°μœΌλ‘œ ν™•μž₯λ˜λŠ” 과정은 AIκ°€ λ‹¨μˆœν•œ 도ꡬλ₯Ό λ„˜μ–΄ '전체 리포지토리'λ‚˜ 'μ±… μˆ˜μ‹­ ꢌ'을 ν†΅μ§Έλ‘œ μ΄ν•΄ν•˜λŠ” μ „λ¬Έκ°€λ‘œ μ§„ν™”ν•˜λŠ” κ³Όμ •." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) μ»¨ν…μŠ€νŠΈ μœˆλ„μš°(Context Window)λŠ” LLM이 ν•œ λ²ˆμ— μ²˜λ¦¬ν•  수 μžˆλŠ” μ΅œλŒ€ 토큰 수λ₯Ό μ˜λ―Έν•˜λ©°, 이λ₯Ό ν™•μž₯ν•˜λŠ” 것은 ν˜„λŒ€ AI μ—°κ΅¬μ˜ 핡심 κ³Όμ œμž…λ‹ˆλ‹€. 1. **λ°œμ „ 단계**: * **초기**: 2,048 ~ 4,096 토큰 (짧은 λŒ€ν™” μœ„μ£Ό). * **κ³ΌκΈ°**: 32,000 ~ 128,000 토큰 (κΈ΄ λ¬Έμ„œ 뢄석 κ°€λŠ₯). * **ν˜„μž¬**: 100만(1M) ~ 1,000만(10M) 토큰 이상 (전체 μ½”λ“œλ² μ΄μŠ€, 수 μ‹œκ°„μ˜ μ˜μƒ 뢄석 κ°€λŠ₯). 2. **평가 μ§€ν‘œ**: * **Needle In A Haystack (NIAH)**: κ±°λŒ€ν•œ 정보(κ±΄μ΄ˆλ”λ―Έ) 속에 μˆ¨κ²¨μ§„ μž‘μ€ 정보(λ°”λŠ˜)λ₯Ό λͺ¨λΈμ΄ μ–Όλ§ˆλ‚˜ μ •ν™•ν•˜κ²Œ μ°Ύμ•„λ‚΄λŠ”μ§€ ν…ŒμŠ€νŠΈν•©λ‹ˆλ‹€. * **RULER**: λ‹¨μˆœ 검색을 λ„˜μ–΄, κΈ΄ λ¬Έλ§₯ μ†μ—μ„œ λ³΅μž‘ν•œ μΆ”λ‘ κ³Ό μš”μ•½ λŠ₯λ ₯을 μ’…ν•©μ μœΌλ‘œ ν‰κ°€ν•˜λŠ” μ΅œμ‹  λ²€μΉ˜λ§ˆν¬μž…λ‹ˆλ‹€. 3. **ν•œκ³„ 극볡 기술**: * **μ•„ν‚€ν…μ²˜ μ΅œμ ν™”**: [[Attention Mechanisms|FlashAttention]], [[Sparse Attention|Sparse Attention]]. * **λ©”λͺ¨λ¦¬ 관리**: [[Key-Value (KV) Cache|KV Cache]] μ΅œμ ν™” 및 [[PagedAttention|PagedAttention]]. * **μœ„μΉ˜ 인코딩 ν™•μž₯**: [[Positional Embeddings (RoPE & Variants)|RoPE, YaRN]] 등을 ν†΅ν•œ ν•™μŠ΅ λ²”μœ„λ₯Ό λ„˜μ–΄μ„œλŠ” μ»¨ν…μŠ€νŠΈ ν™•μž₯. ## βš–οΈ Trade-offs & Caveats * **Lost in the middle**: μ»¨ν…μŠ€νŠΈκ°€ κΈΈμ–΄μ§ˆμˆ˜λ‘ λͺ¨λΈμ΄ μ•žλΆ€λΆ„κ³Ό λ’·λΆ€λΆ„μ˜ μ •λ³΄λŠ” 잘 κΈ°μ–΅ν•˜μ§€λ§Œ, 쀑간에 μœ„μΉ˜ν•œ μ •λ³΄λŠ” λ¬΄μ‹œν•˜κ±°λ‚˜ μžŠμ–΄λ²„λ¦¬λŠ” ν˜„μƒμ΄ λ°œμƒν•©λ‹ˆλ‹€. * **μ—°μ‚° λΉ„μš© 폭발**: μ–΄ν…μ…˜ 연산은 μ‹œν€€μŠ€ 길이의 제곱($O(n^2)$)에 λΉ„λ‘€ν•˜λ―€λ‘œ, μ»¨ν…μŠ€νŠΈκ°€ 2λ°° λŠ˜μ–΄λ‚˜λ©΄ μ—°μ‚°λŸ‰κ³Ό λ©”λͺ¨λ¦¬λŠ” 4배둜 μ¦κ°€ν•©λ‹ˆλ‹€. * **정확도 ν•˜λ½**: μ»¨ν…μŠ€νŠΈ 창은 ν¬μ§€λ§Œ, μ‹€μ œ λ‚΄λΆ€ 정보에 λŒ€ν•œ 이해도(Recall)κ°€ λ–¨μ–΄μ§€λŠ” 'κ°€μ§œ μ»¨ν…μŠ€νŠΈ ν™•μž₯' λͺ¨λΈμ„ 경계해야 ν•©λ‹ˆλ‹€. ## πŸ”— 지식 μ—°κ²° (Graph) * **기술적 기반**: [[Positional Embeddings (RoPE & Variants)|Positional Embeddings]], [[Attention Mechanisms|Attention Mechanisms]] * **물리적 μ œμ•½**: [[KV Cache|KV Cache]], [[GPU Infrastructure|GPU Infrastructure]] * **ν•΄κ²° μ „λž΅**: [[Retrieval-Augmented Generation (RAG)|RAG]], [[Lost in the Middle & Context Rot|Lost in the Middle & Context Rot]] --- *Last updated: 2026-05-04*