--- id: P-REINFORCE-AI-ADAPT-COMP category: "[[10_Wiki/πŸ’‘ Topics/AI]]" confidence_score: 0.99 tags: [Adaptive Compute, AI, Efficiency, Inference, Optimization] last_reinforced: 2026-04-20 --- # [[Adaptive-Compute]] (μ μ‘ν˜• κ³„μ‚°λŸ‰ 쑰절) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μ‰¬μš΄ λ¬Έμ œλŠ” 빨리 ν’€κ³ , μ–΄λ €μš΄ λ¬Έμ œλŠ” 더 κ³ λ―Όν•˜λΌ." λ°μ΄ν„°μ˜ λ³΅μž‘λ„μ— 따라 μ‹ κ²½λ§μ˜ μΈ΅(Layer)μ΄λ‚˜ νŒŒλΌλ―Έν„°λ₯Ό μœ λ™μ μœΌλ‘œ μ‚¬μš©ν•˜μ—¬ μ—°μ‚° νš¨μœ¨μ„ κ·ΉλŒ€ν™”ν•˜λŠ” μ§€λŠ₯적 μ΅œμ ν™”λ‹€. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **Early Exit Strategies**: - ν•˜μœ„ λ ˆμ΄μ–΄μ—μ„œ 이미 κ²°κ³Όκ°€ ν™•μ‹€ν•  경우, μƒμœ„ λ ˆμ΄μ–΄ 연산을 κ±΄λ„ˆλ›°κ³  정닡을 좜λ ₯ν•˜μ—¬ 응닡 속도λ₯Ό 높인닀. - **Dynamic Gating**: - νŠΉμ • μž…λ ₯값에 ν•„μš”ν•œ 'μ „λ¬Έκ°€ 신경망'만 μ„ λ³„μ μœΌλ‘œ ν™œμ„±ν™”ν•˜μ—¬ 전체 μ—°μ‚°λŸ‰μ„ μ€„μ΄λŠ” 방식(Mixture of Experts와 κΆ€λ₯Ό 같이함). - **Inference Cost Reduction**: - λΆˆν•„μš”ν•œ 연산을 μ€„μž„μœΌλ‘œμ¨ ν΄λΌμš°λ“œ API 호좜 λΉ„μš©μ΄λ‚˜ μ˜¨λ””λ°”μ΄μŠ€ AI의 배터리 μ†Œλͺ¨λ₯Ό 획기적으둜 μ ˆκ°ν•œλ‹€. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (RL Update) - κ³„μ‚°λŸ‰μ„ μ€„μ΄λŠ” κ³Όμ •μ—μ„œ μ•„μ£Ό λ“œλ¬Όκ²Œ λ°œμƒν•˜λŠ” 'μ–΄λ €μš΄ μ˜ˆμ™Έ 상황(Edge case)'μ—μ„œ μ„±λŠ₯이 μ†Œν­ ν•˜λ½ν•  수 μžˆλ‹€. λ”°λΌμ„œ μ„±λŠ₯ 손싀과 λΉ„μš© 절감 μ‚¬μ΄μ˜ 'Pareto Optimal' 지점을 μ°ΎλŠ” 것이 곡학적 핡심이닀. ## πŸ”— 지식 μ—°κ²° (Graph) - Related: [[Dense-vs-Sparse-Neural-Networks]] , [[Deep-Learning-Architecture-Patterns]] - Foundation: [[Computational-Efficiency]]