--- id: P-REINFORCE-AUTO-DDIS-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 0.93 tags: [auto-reinforced, data-distillation, machine-learning, model-compression, efficiency, dataset-synthesis] last_reinforced: 2026-04-20 --- # [[Data Distillation (데이터 증λ₯˜)]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "λ°μ΄ν„°μ˜ μ—μŠ€ν”„λ ˆμ†Œ μΆ”μΆœ: 1,000개의 μ΄λ―Έμ§€λ‘œ 곡뢀해야 ν•  지식을 단 10개의 '증λ₯˜λœ 이미지'에 ν•¨μΆ•ν•¨μœΌλ‘œμ¨, 손바λ‹₯만 ν•œ λ°μ΄ν„°μ…‹λ§ŒμœΌλ‘œλ„ κ±°λŒ€ν•œ λͺ¨λΈμ„ κ°€λ₯΄μΉ  수 있게 λ§Œλ“œλŠ” 고밀도 정보 μ••μΆ•μ˜ 기술." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) 데이터 증λ₯˜(Data Distillation)λŠ” κ±°λŒ€ν•œ λ°μ΄ν„°μ…‹μ˜ 지식을 핡심적인 μ†Œμˆ˜ λ°μ΄ν„°μ…‹μœΌλ‘œ μš”μ•½ν•˜μ—¬ λͺ¨λΈμ˜ ν•™μŠ΅ νš¨μœ¨μ„ κ·ΉλŒ€ν™”ν•˜λŠ” κΈ°λ²•μž…λ‹ˆλ‹€. 1. **μž‘λ™ 원리**: * 전체 λ°μ΄ν„°λ‘œ ν•™μŠ΅ν•œ '슀승 λͺ¨λΈ(Teacher)'의 행동 νŒ¨ν„΄μ΄λ‚˜ κ·Έλž˜λ””μ–ΈνŠΈ 정보λ₯Ό λ³΄μ‘΄ν•˜λ©΄μ„œ, μ•„μ£Ό μž‘μ€ 'κ°€κ³΅λœ 데이터셋'을 생성. * 이 증λ₯˜λœ λ°μ΄ν„°λ‘œ ν•™μŠ΅ν•œ '제자 λͺ¨λΈ(Student)'이 전체 λ°μ΄ν„°λ‘œ ν•™μŠ΅ν•œ νš¨κ³Όμ™€ μœ μ‚¬ν•œ μ„±λŠ₯을 내도둝 μ΅œμ ν™”. 2. **μ™œ μ€‘μš”ν•œκ°€?**: * **Storage Efficiency**: λ°©λŒ€ν•œ 데이터λ₯Ό 보관할 ν•„μš”κ°€ μ—†μŒ. * **Training Speed**: 데이터 양이 μ μœΌλ―€λ‘œ ν•™μŠ΅ μ‹œκ°„μ΄ 극적으둜 단좕됨. (Optimizationκ³Ό μ—°κ²°) * **Privacy**: 원본 데이터λ₯Ό 직접 μ‚¬μš©ν•˜μ§€ μ•Šκ³  κ°€κ³΅λœ μ •λ³΄λ§Œ μ‚¬μš©ν•˜λ―€λ‘œ λ³΄μ•ˆμ— μœ λ¦¬ν•¨. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±°μ—λŠ” 무쑰건 '데이터가 λ§Žμ„μˆ˜λ‘ μ’‹λ‹€'λŠ” μ •μ±…(Big Data)이 μš°μ„Έν–ˆμœΌλ‚˜, ν˜„λŒ€ 정책은 λΆˆν•„μš”ν•œ λ…Έμ΄μ¦ˆλ₯Ό λΊ€ '고밀도 μ •μ œ 데이터 μ •μ±…'이 λͺ¨λΈμ˜ μ§€λŠ₯ 밀도λ₯Ό λ†’μ΄λŠ” 데 더 νš¨κ³Όμ μž„μ„ μž…μ¦ν•¨(RL Update). - **μ •μ±… λ³€ν™”(RL Update)**: μ΅œκ·Όμ—λŠ” LLM을 μ΄μš©ν•΄ κ³ ν’ˆμ§ˆμ˜ ν•©μ„± 데이터λ₯Ό μƒμ„±ν•˜κ³  이λ₯Ό λ‹€μ‹œ μ†Œν˜• λͺ¨λΈ ν•™μŠ΅μ— μ‚¬μš©ν•˜λŠ” '자기 증λ₯˜(Self-distillation) μ •μ±…'이 μ†Œν˜• λͺ¨λΈ(sLLM) μ „λž΅μ˜ 핡심 정책이 됨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Big-Data]], [[Optimization]], [[Efficiency]], [[Model-Compression]], [[CV_Synthesis]] - **Modern Tech/Tools**: Dataset Distillation techniques (Matching Gradients), Synthetic datasets. ---