--- id: lifelong-learning title: "Lifelong Learning" category: "10_Wiki/Topics" status: "draft" verification_status: "conceptual" canonical_id: "" aliases: ["Continual Learning", "Incremental Learning"] duplicate_of: "" source_trust_level: "B" confidence_score: 0.85 created_at: 2026-06-12 updated_at: 2026-06-12 review_reason: "" merge_history: [] tags: ["research", "self envolving"] raw_sources: ["NotebookLM Synthesis"] applied_in: ["https://github.com/ag2ai/Live-Evo", "https://github.com/Edaizi/EvolveR", "LifelongAgentBench"] github_commit: "" --- # [[Lifelong Learning]] ## 🎯 ν•œ 쀄 톡찰 (One-line insight) 이전에 μŠ΅λ“ν•œ 지식과 λŠ₯λ ₯을 μœ μ§€ν•˜λ©΄μ„œ(Stability) μƒˆλ‘œμš΄ μž‘μ—…κ³Ό ν™˜κ²½μ— λ…ΈμΆœλ  λ•Œ 지속적이고 μ μ‘μ μœΌλ‘œ ν•™μŠ΅ν•˜λŠ” AI λͺ¨λΈμ˜ 핡심 λŠ₯λ ₯이닀 [1]. ## 🧠 핡심 κ°œλ… (Core concepts) - **μ•ˆμ •μ„±-κ°€μ†Œμ„± λ”œλ ˆλ§ˆ (Stability-Plasticity Dilemma):** κΈ°μ‘΄ 지식을 λ³΄μ‘΄ν•˜λŠ” μ•ˆμ •μ„±κ³Ό μƒˆλ‘œμš΄ 지식을 μˆ˜μš©ν•˜λŠ” κ°€μ†Œμ„± μ‚¬μ΄μ—μ„œ κ· ν˜•μ„ λ§žμΆ”λŠ” 핡심 κ³Όμ œμ΄λ‹€ [1]. - **파괴적 망각 (Catastrophic Forgetting):** μƒˆλ‘œμš΄ 정보λ₯Ό ν•™μŠ΅ν•˜λŠ” 과정이 이전에 ν•™μŠ΅λœ 정보λ₯Ό μ§€μš°κ±°λ‚˜ ν›Όμ†ν•˜λŠ” ν˜„μƒμ΄λ‹€ [1-3]. - **지식 μœ μ§€ 및 전이 (Retention & Transfer):** 과거의 지식을 μœ μ§€ν•˜λ©΄μ„œ 이λ₯Ό μƒˆλ‘œμš΄ λ˜λŠ” 순차적인 μž‘μ—…μ— μ μš©ν•˜λŠ” λŠ₯λ ₯이닀 [4, 5]. - **순차적 μž‘μ—… μ„€μ • (Sequential Task Setting):** 동적인 ν™˜κ²½μ—μ„œ μ—°μ†μ μœΌλ‘œ λ°œμƒν•˜λŠ” μž‘μ—…μ„ μ²˜λ¦¬ν•˜λŠ” ν•™μŠ΅ ν™˜κ²½μ„ μ˜λ―Έν•œλ‹€ [1, 6]. ## 🧩 μΆ”μΆœλœ νŒ¨ν„΄ (Extracted patterns) - **ν•™μŠ΅ μ‹œμ  λ©”λͺ¨λ¦¬ ν™œμš©:** 평생 ν•™μŠ΅(Lifelong Learning)μ—μ„œμ˜ λ©”λͺ¨λ¦¬ λ©”μ»€λ‹ˆμ¦˜(κ²½ν—˜ μž¬μƒ 버퍼 λ“±)은 주둜 경사 ν•˜κ°•λ²•μ„ ν†΅ν•œ λ§€κ°œλ³€μˆ˜ μ΅œμ ν™”λ₯Ό μœ„ν•΄ **ν•™μŠ΅ μ‹œμ (Training-time)**에 λ„κ΅¬λ‘œ μ‚¬μš©λœλ‹€ [1]. - **μˆ˜λ™μ  지식 μŠ΅λ“:** 전톡적인 평생 ν•™μŠ΅μ€ 주둜 μ™ΈλΆ€μ—μ„œ μ œκ³΅λ˜λŠ” μž‘μ—… μ‹œν€€μŠ€λ₯Ό 톡해 μˆ˜λ™μ μœΌλ‘œ 지식을 μŠ΅λ“ν•˜λŠ” κ²½ν–₯이 μžˆλ‹€ [1]. - **원칙 쀑심 κ²½ν—˜ λ‚΄μž¬ν™”:** λ‹¨μˆœν•œ μΈμŠ€ν„΄μŠ€ μˆ˜μ€€μ˜ 기둝보닀 원칙 μˆ˜μ€€(Principle-level)으둜 κ²½ν—˜μ„ μΆ”μƒν™”ν•˜μ—¬ μ €μž₯ν•˜λŠ” 것이 닀쀑 반볡 ν•™μŠ΅ μ‹œ μ„±λŠ₯ λΆ•κ΄΄λ₯Ό λ§‰λŠ” 데 μœ λ¦¬ν•˜λ‹€ [7]. ## πŸ“– μ„ΈλΆ€ λ‚΄μš© (Details) - **μ •μ˜ 및 λ²”μœ„:** 평생 ν•™μŠ΅μ€ 지속적 ν•™μŠ΅(Continual Learning) λ˜λŠ” 점진적 ν•™μŠ΅(Incremental Learning)μœΌλ‘œλ„ 뢈리며, 동적이고 λ³΅μž‘ν•œ ν™˜κ²½μ—μ„œ AI λͺ¨λΈμ΄ 운영되기 μœ„ν•œ ν•„μˆ˜μ μΈ νŒ¨λŸ¬λ‹€μž„μ΄λ‹€ [1]. - **μžκ°€ μ§„ν™” μ—μ΄μ „νŠΈ(Self-evolving Agents)μ™€μ˜ 관계:** - 평생 ν•™μŠ΅μ€ 주둜 λͺ¨λΈμ˜ λ§€κ°œλ³€μˆ˜ μ—…λ°μ΄νŠΈμ— μ§‘μ€‘ν•˜λŠ” 반면, μžκ°€ μ§„ν™” μ—μ΄μ „νŠΈλŠ” 도ꡬ μŠ΅λ“, μ•„ν‚€ν…μ²˜ μž¬κ΅¬μ„±, ν™˜κ²½ 탐색을 ν¬ν•¨ν•˜λŠ” μ‹œμŠ€ν…œ μ „μ²΄μ˜ μ§„ν™”λ₯Ό λͺ©ν‘œλ‘œ ν•œλ‹€ [1, 8]. - μžκ°€ μ§„ν™” μ—μ΄μ „νŠΈλŠ” 평생 ν•™μŠ΅μ˜ 순차적 μž‘μ—… 섀정을 κ³΅μœ ν•˜μ§€λ§Œ, μ‹€ν–‰ μ‹œμ (Runtime)의 μ»¨ν…μŠ€νŠΈ(ν”„λ‘¬ν”„νŠΈ, μž‘μ—… λ©”λͺ¨λ¦¬ λ“±)λ₯Ό ν™œμš©ν•˜μ—¬ λ§€κ°œλ³€μˆ˜ μ—…λ°μ΄νŠΈ 없이도 μ¦‰κ°μ μœΌλ‘œ 행동을 μ‘°μ •ν•œλ‹€λŠ” μ μ—μ„œ 차이가 μžˆλ‹€ [1]. - **κ΅¬ν˜„ λ©”μ»€λ‹ˆμ¦˜:** - **κ²½ν—˜ μž¬μƒ(Experience Replay):** 과거의 데이터λ₯Ό λ³΄κ΄€ν–ˆλ‹€κ°€ μƒˆλ‘œμš΄ ν•™μŠ΅ μ‹œ ν•¨κ»˜ μ‚¬μš©ν•˜μ—¬ 망각을 λ°©μ§€ν•œλ‹€ [1]. - **λ§€κ°œλ³€μˆ˜ 효율적 λ―Έμ„Έ μ‘°μ •(PEFT):** νŠΉμ • λͺ¨λΈ λΆ€λΆ„λ§Œ μ—…λ°μ΄νŠΈν•˜μ—¬ κΈ°μ‘΄ μ§€μ‹μ˜ 훼손을 μ΅œμ†Œν™”ν•œλ‹€ [3]. - **계측적 λ©”λͺ¨λ¦¬:** μ „λž΅μ , 절차적, 도ꡬ μ‚¬μš© λ©”λͺ¨λ¦¬λ‘œ κ²½ν—˜μ„ μ‘°μ§ν™”ν•˜μ—¬ μž₯기적인 μ—­λŸ‰μ„ κ΅¬μΆ•ν•œλ‹€ [9]. - **평가 및 벀치마크:** - **Long-horizon 평가:** μž₯기적인 ν•™μŠ΅ κΆ€μ μ—μ„œ μ§€μ‹μ˜ 좕적과 퇴보λ₯Ό μΈ‘μ •ν•˜λŠ” 것이 μ€‘μš”ν•˜λ©°, μ—ν”Όμ†Œλ“œ κ°„ μƒνƒœκ°€ μœ μ§€λ˜λŠ” 섀정이 ν•„μš”ν•˜λ‹€ [10, 11]. - **μ£Όμš” μ§€ν‘œ:** 망각λ₯ (FGT), 역전이(BWT, μƒˆλ‘œμš΄ ν•™μŠ΅μ΄ κ³Όκ±° μž‘μ—… μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 정도) 등이 μ‚¬μš©λœλ‹€ [2, 12]. ## βš–οΈ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & updates) - **ν•™μŠ΅ μ£Όλ„κΆŒμ˜ λ³€ν™”:** κ³Όκ±°μ—λŠ” μ™ΈλΆ€μ—μ„œ μ£Όμ–΄μ§„ 데이터λ₯Ό ν•™μŠ΅ν•˜λŠ” '문제 μ„€μ • λ·°(Problem-setting view)'둜 κ°„μ£Όλ˜μ—ˆμœΌλ‚˜, μ΅œμ‹  μ—°κ΅¬μ—μ„œλŠ” μ—μ΄μ „νŠΈκ°€ 슀슀둜 νƒμƒ‰ν•˜κ³  λ°˜μ°°ν•˜λŠ” 'ν•΄κ²° νŒ¨λŸ¬λ‹€μž„ λ·°(Solution-paradigm view)'둜 ν™•μž₯되고 μžˆλ‹€ [13, 14]. - **κ²½ν—˜ λ‚΄μž¬ν™”μ˜ μœ„ν—˜μ„±:** 닀쀑 반볡 ν•™μŠ΅ μ‹œ μ˜¨ν΄λ¦¬μ‹œ(On-policy) μ»¨ν…μŠ€νŠΈ 증λ₯˜λ₯Ό μ‚¬μš©ν•  경우 κ°œμ„ μ΄ μ•„λ‹Œ '점진적 μ—­λŸ‰ λΆ•κ΄΄(Progressive capability collapse)'κ°€ λ°œμƒν•  수 μžˆλ‹€λŠ” 사싀이 λ°œκ²¬λ˜μ—ˆλ‹€ [7]. ## πŸ› οΈ 적용 사둀 (Applied in summary) - **DarwinTOD:** νƒœμŠ€ν¬ μ§€ν–₯ λŒ€ν™” μ‹œμŠ€ν…œμ—μ„œ μΈκ°„μ˜ κ°œμž… 없이 μ§€μ†μ μœΌλ‘œ μ „λž΅μ„ μ΅œμ ν™”ν•˜κΈ° μœ„ν•΄ μ§„ν™” μ—°μ‚°κ³Ό 평생 ν•™μŠ΅μ„ κ²°ν•©ν•˜μ˜€λ‹€ [15]. - **LifelongAgentBench:** λ°μ΄ν„°λ² μ΄μŠ€(DB), 운영체제(OS), 지식 κ·Έλž˜ν”„(KG) 도메인에 걸쳐 μƒν˜Έ 의쑴적인 μž‘μ—… μ‹œν€€μŠ€λ₯Ό κ΅¬μ„±ν•˜μ—¬ μ—μ΄μ „νŠΈμ˜ 평생 ν•™μŠ΅ λŠ₯λ ₯을 ν‰κ°€ν•˜λŠ” 벀치마크둜 ν™œμš©λœλ‹€ [16, 17]. - **Live-Evo:** 지속적인 ν”Όλ“œλ°±κ³Ό 뢄포 λ³€ν™”(Distribution shift)κ°€ λ°œμƒν•˜λŠ” 라이브 데이터 μŠ€νŠΈλ¦Όμ—μ„œ μ—μ΄μ „νŠΈ λ©”λͺ¨λ¦¬λ₯Ό 온라인으둜 μ§„ν™”μ‹œν‚€λŠ” μ‹œμŠ€ν…œμ΄λ‹€ [18]. - **MUSE:** 계측적 λ©”λͺ¨λ¦¬ λͺ¨λ“ˆμ„ 톡해 μ‹€ν–‰-반찰-κΈ°μ–΅ 루프λ₯Ό μˆ˜ν–‰ν•˜λ©° μž₯κΈ° μž‘μ—…μ—μ„œ '업무 쀑 ν•™μŠ΅(Learning on the job)'을 κ΅¬ν˜„ν•˜μ˜€λ‹€ [9, 19]. ## βœ… 검증 μƒνƒœ 및 신뒰도 - **μƒνƒœ:** draft - **검증 단계:** conceptual (μ‹€μ œ 적용 사둀 발견 μ‹œ applied/validated둜 승격 κ°€λŠ₯) - **좜처 신뒰도:** B (Official Documentation / Primary Source via NotebookLM) - **쀑볡 검사 κ²°κ³Ό:** μ‹ κ·œ 생성 (New discovery) ## πŸ“ λ³€κ²½ 이λ ₯ (Change history) - 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine.