--- id: recursive-self-design title: "Recursive Self-Design" category: "10_Wiki/Topics" status: "draft" verification_status: "conceptual" canonical_id: "" aliases: ["μžκ°€ 섀계", "Recursive Source-code Improvement"] duplicate_of: "" source_trust_level: "B" confidence_score: 0.85 created_at: 2026-06-12 updated_at: 2026-06-12 review_reason: "" merge_history: [] tags: ["research", "self envolving"] raw_sources: ["NotebookLM Synthesis"] applied_in: ["https://github.com/jennyzzt/dgm", "https://github.com/DunLi-Tsinghua/MetaAI-Mini", "https://github.com/ShengranHu/ADAS", "https://github.com/SWE-agent/SWE-agent"] github_commit: "" --- # [[Recursive Self-Design]] ## 🎯 ν•œ 쀄 톡찰 (One-line insight) AIκ°€ λ‹¨μˆœνžˆ μ •ν•΄μ§„ 섀계 곡간 λ‚΄μ—μ„œ λ§€κ°œλ³€μˆ˜λ₯Ό μ΅œμ ν™”ν•˜λŠ” 것을 λ„˜μ–΄, μžμ‹ μ„ κ΅¬μΆ•Β·ν‰κ°€Β·κ°œμ„ ν•˜λŠ” λ©”μ»€λ‹ˆμ¦˜(도ꡬ, μ›Œν¬ν”Œλ‘œμš°, ν”„λ‘¬ν”„νŠΈ μ •μ±… λ“±) 자체λ₯Ό 슀슀둜 μˆ˜μ •ν•˜κ³  ν™•μž₯ν•˜λŠ” νŒ¨λŸ¬λ‹€μž„μ΄λ‹€ [1-3]. ## 🧠 핡심 κ°œλ… (Core concepts) 이 주제λ₯Ό κ΅¬μ„±ν•˜λŠ” 4κ°€μ§€ 운영 κΈ°μ€€(Operational Criteria)은 λ‹€μŒκ³Ό κ°™λ‹€ [3, 4]: 1. **검사 κ°€λŠ₯ν•œ λŒ€μƒ μ‹œμŠ€ν…œ (Inspectable target system):** μ•„ν‚€ν…μ²˜, 도ꡬ, μ›Œν¬ν”Œλ‘œμš°, ν”„λ‘¬ν”„νŠΈ, λ©”λͺ¨λ¦¬ λ˜λŠ” μ½”λ“œ μˆ˜μ€€ 정책을 κ²€μ‚¬ν•˜κ³  μˆ˜μ •ν•  수 μžˆλŠ” λŒ€μƒ AIκ°€ μ‘΄μž¬ν•΄μ•Ό 함. 2. **메타 μˆ˜μ€€ μˆ˜μ •μž (Meta-level modifier):** λ‹¨μˆœν•œ λ¬΄μž‘μœ„ μ„­λ™μ΄λ‚˜ μΈκ°„μ˜ νŒ¨μΉ˜κ°€ μ•„λ‹Œ, AI 기반 ν”„λ‘œμ„ΈμŠ€κ°€ λŒ€μƒ μ‹œμŠ€ν…œμ˜ λ³€κ²½ 사항을 μ œμ•ˆν•¨. 3. **ν”Όλ“œλ°± 기반 선택 (Feedback-directed selection):** μ œμ•ˆλœ λ³€κ²½ 사항을 μ™ΈλΆ€ μž‘μ—…μ΄λ‚˜ μœ ν‹Έλ¦¬ν‹° ν•¨μˆ˜λ‘œ ν‰κ°€ν•˜κ³ , κ·Έ ν”Όλ“œλ°±μ΄ 후손 μ‹œμŠ€ν…œμ˜ μœ μ§€ 여뢀에 영ν–₯을 λ―ΈμΉ¨. 4. **μž¬κ·€μ  지속성 (Recursive continuation):** μ„ νƒλœ 후손 μ‹œμŠ€ν…œμ΄ λ‹€μŒ λ‹¨κ³„μ˜ κ°œμ„ μ„ μœ„ν•œ μ‹œμž‘μ μ΄ λ˜μ–΄ 루프λ₯Ό ν˜•μ„±ν•¨. ## 🧩 μΆ”μΆœλœ νŒ¨ν„΄ (Extracted patterns) - **Human Zero-to-One vs. AI One-to-N:** 인간은 μ‹œλ“œ(Seed) μ‹œμŠ€ν…œ, μ œμ•½ 쑰건, 평가 ν”„λ‘œν† μ½œ 및 μ•ˆμ „ 경계λ₯Ό μ •μ˜(0 to 1)ν•˜κ³ , AIλŠ” 이λ₯Ό 기반으둜 ꡬ체적인 후손 μ„€κ³„μ•ˆμ„ 반볡적으둜 μƒμ„±ν•˜κ³  ν™•μž₯(1 to N)ν•œλ‹€ [5-8]. - **경계 λ‚΄λΆ€ μ΅œμ ν™”μ™€ μžκ°€ μ„€κ³„μ˜ 뢄리:** 일반적인 μ΅œμ ν™”κ°€ κ³ μ •λœ 섀계 곡간($D_t$) λ‚΄μ—μ„œ λ§€κ°œλ³€μˆ˜($x_t$)λ₯Ό μ‘°μ •ν•œλ‹€λ©΄, μž¬κ·€μ  μžκ°€ μ„€κ³„λŠ” 전이 μ—°μ‚°μž($\Psi$)λ₯Ό 톡해 섀계 ꡬ쑰($S_t$) 자체λ₯Ό λ³€ν˜•ν•œλ‹€ [9-11]. - **μ•„μΉ΄μ΄λΈŒ 기반 μ§„ν™”:** λΆ€λͺ¨ μ—μ΄μ „νŠΈκ°€ μžμ‹ μ˜ 벀치마크 둜그λ₯Ό λΆ„μ„ν•˜μ—¬ μ½”λ“œ μˆ˜μ •μ„ μ œμ•ˆν•˜κ³ , μ„±λŠ₯이 μž…μ¦λœ ν›„μ†λ§Œ μ•„μΉ΄μ΄λΈŒμ— μ €μž₯ν•˜μ—¬ λ‹€μ–‘ν•œ μ§„ν™” 경둜λ₯Ό λ³΄μ‘΄ν•œλ‹€ [8, 12, 13]. ## πŸ“– μ„ΈλΆ€ λ‚΄μš© (Details) - **μˆ˜ν•™μ  곡식화:** μžκ°€ 섀계 μ‹œμŠ€ν…œμ˜ ꡬ쑰적 ꡬ성 $S_{t+1} = \Psi(S_t, R_t, C_t)$ 둜 ν‘œν˜„λ˜λ©°, μ—¬κΈ°μ„œ $R_t$λŠ” ν™˜κ²½ ν”Όλ“œλ°±, $C_t$λŠ” μ•ˆμ „ μ œμ•½ 쑰건이닀 [9, 10]. - **μ½”λ“œ 레벨의 μŠ€μΊν΄λ“œ μˆ˜μ •:** ν˜„λŒ€μ˜ νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈμ€ λŒ€κ°œ 동결(Frozen)λ˜μ–΄ μžˆμœΌλ―€λ‘œ, μžκ°€ μ„€κ³„λŠ” 주둜 λͺ¨λΈ κ°€μ€‘μΉ˜κ°€ μ•„λ‹Œ μ—μ΄μ „νŠΈμ˜ **μŠ€μΊν΄λ“œ(Scaffold)**, 즉 도ꡬ μΈν„°νŽ˜μ΄μŠ€, μ»¨ν…μŠ€νŠΈ 관리, 패치 μˆœμœ„ μ§€μ • μ›Œν¬ν”Œλ‘œμš° 등을 μˆ˜μ •ν•˜λŠ” 데 μ§‘μ€‘ν•œλ‹€ [3, 14-16]. - **DGM(Darwin GΓΆdel Machine)의 증거:** μ‹œλ“œ μ—μ΄μ „νŠΈκ°€ 80회의 반볡 μˆ˜μ •μ„ 거치며 κ°€μ€‘μΉ˜ λ³€κ²½ 없이 SWE-bench Verifiedμ—μ„œ 20%μ—μ„œ 50%둜, Polyglotμ—μ„œ 14.2%μ—μ„œ 30.7%둜 μ„±λŠ₯을 ν–₯μƒμ‹œν‚¨ 사둀가 λ³΄κ³ λ˜μ—ˆλ‹€ [1, 17-19]. - **ꡬ쑰적 κ°œμ„ μ˜ ꡬ체적 양상:** [19, 20] - **파일 λ·°μ–΄ μ„ΈλΆ„ν™”:** 전체 파일 λŒ€μ‹  κ΄€λ ¨ 라인 λ²”μœ„λ§Œ μ‘°νšŒν•˜μ—¬ μ»¨ν…μŠ€νŠΈ λΆ€λ‹΄ κ°μ†Œ. - **λ¬Έμžμ—΄ μΉ˜ν™˜ νŽΈμ§‘:** 전체 파일 νŽΈμ§‘ λŒ€μ‹  μ •λ°€ν•œ ν•˜μœ„ λ¬Έμžμ—΄ ꡐ체 방식 채택. - **패치 검증 및 μž¬μ‹œλ„:** λΉ„μ–΄ μžˆκ±°λ‚˜ ν…ŒμŠ€νŠΈ μ „μš©μΈ 패치λ₯Ό κ°μ§€ν•˜μ—¬ μž¬μ‹œλ„ 둜직 가동. - **μ»¨ν…μŠ€νŠΈ μ°½ 관리:** ν•œκ³„ 도달 μ‹œ λŒ€ν™” 기둝 μš”μ•½ λ©”μ»€λ‹ˆμ¦˜ λ„μž…. ## βš–οΈ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & updates) - **κ°€μ€‘μΉ˜ λ™κ²°μ˜ ν•œκ³„:** ν˜„μž¬μ˜ μž¬κ·€μ  μžκ°€ μ„€κ³„λŠ” μ™„μ „ν•œ AGIλ‚˜ μ§€λŠ₯ ν­λ°œμ„ 증λͺ…ν•œ 것은 μ•„λ‹ˆλ©°, 주둜 **λ™κ²°λœ νŒŒμš΄λ°μ΄μ…˜ λͺ¨λΈ** μœ„μ—μ„œ μ½”λ“œ 레벨의 도ꡬ와 μ›Œν¬ν”Œλ‘œμš°λ₯Ό μˆ˜μ •ν•˜λŠ” μˆ˜μ€€μ— 머물러 μžˆλ‹€ [14, 21, 22]. - **νƒν—˜ vs κ°œμ„ μ˜ 상좩:** 곡개된 절제 μ‹€ν—˜(Ablation) 결과에 λ”°λ₯΄λ©΄, μžκ°€ 섀계 λ£¨ν”„μ—μ„œ 'μ˜€ν”ˆ μ—”λ“œ νƒν—˜(Open-ended exploration)'을 μ œκ±°ν•  경우 μ„±λŠ₯이 λŒ€ν­ ν•˜λ½(50% -> 23%)ν•˜λ©°, μ΄λŠ” λ‹¨μˆœν•œ μ„±λŠ₯ κ°œμ„  μ‹œλ„λ³΄λ‹€ μƒˆλ‘œμš΄ κ°€λŠ₯성을 μ°ΎλŠ” νƒν—˜ 과정이 ν•„μˆ˜μ μž„μ„ μ‹œμ‚¬ν•œλ‹€ [18, 19, 23]. ## πŸ› οΈ 적용 사둀 (Applied in summary) - **DGM (Darwin GΓΆdel Machine):** μ½”λ“œ 레벨 μ—μ΄μ „νŠΈ μŠ€μΊν΄λ“œ, νŽΈμ§‘ 도ꡬ, ν”„λ‘¬ν”„νŠΈ 정책을 슀슀둜 μˆ˜μ •ν•˜λŠ” μ‹œμŠ€ν…œμœΌλ‘œ, GitHub μ €μž₯μ†Œ `https://github.com/jennyzzt/dgm`에 μ‹€ν—˜ μ•„ν‹°νŒ©νŠΈκ°€ κ³΅κ°œλ˜μ–΄ 있음 [11, 24-26]. - **MetaAI-Mini:** ꡐ윑용 및 독립 싀행을 μœ„ν•΄ μ„€κ³„λœ κ²½λŸ‰ μž¬κ·€μ  μžκ°€ 섀계 ν”„λ‘œν† μ½œλ‘œ, HumanEval λ°μ΄ν„°μ…‹μ˜ ν•˜μœ„ 집합을 μ‚¬μš©ν•˜μ—¬ μ„±λŠ₯ ν–₯상 μ‹œμ—λ§Œ 후보λ₯Ό μœ μ§€ν•˜λŠ” 루프λ₯Ό κ΅¬ν˜„ν•¨. μ½”λ“œ μœ„μΉ˜: `https://github.com/DunLi-Tsinghua/MetaAI-Mini` [22, 27, 28]. - **STOP (Self-Taught Optimizer):** κ³ μ •λœ LLM을 μ‚¬μš©ν•˜μ—¬ μŠ€μΊν΄λ”© ν”„λ‘œκ·Έλž¨μ„ μž¬κ·€μ μœΌλ‘œ κ°œμ„ ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬ [29, 30]. - **ADAS (Automated Design of Agentic Systems):** 메타 μ—μ΄μ „νŠΈκ°€ μ½”λ“œ 레벨의 μ—μ΄μ „νŠΈ 섀계λ₯Ό νƒμƒ‰ν•˜λŠ” μ‹œμŠ€ν…œ. μ½”λ“œ μœ„μΉ˜: `https://github.com/ShengranHu/ADAS` [16, 25, 30, 31]. ## βœ… 검증 μƒνƒœ 및 신뒰도 - **μƒνƒœ:** draft - **검증 단계:** conceptual (DGM λ“±μ˜ μ‹œμŠ€ν…œμ„ 톡해 μ‹€ν—˜μ  증거가 ν™•μΈλ˜μ—ˆμœΌλ‚˜, μΌλ°˜ν™”λœ ν”„λ ˆμž„μ›Œν¬λ‘œ 확립 쀑인 단계) - **좜처 신뒰도:** B (ArXiv 및 학계 연ꡬ λ³΄κ³ μ„œ 기반, 일뢀 μ‹œμŠ€ν…œμ˜ 곡개 μ½”λ“œ μ €μž₯μ†Œ 확인됨) - **쀑볡 검사 κ²°κ³Ό:** μ‹ κ·œ 생성 (New discovery) ## πŸ”— κ΄€λ ¨ λ¬Έμ„œ 링크 (Related document links) ### μƒμœ„/μœ μ‚¬ κ°œλ… #### [관계 μœ ν˜• A: μ•„ν‚€ν…μ²˜/기반 기술] - [[self-evolving agents]] - μ—°κ²° 이유: μžκ°€ μ„€κ³„λŠ” μžκ°€ μ§„ν™” μ—μ΄μ „νŠΈκ°€ μ§„ν™”ν•˜λŠ” ꡬ체적인 방법둠 쀑 ν•˜λ‚˜μž„ [2, 32]. - 이 κ°œλ…μ„ 톡해 더 깊게 이해할 수 μžˆλŠ” λΆ€λΆ„: μ—μ΄μ „νŠΈκ°€ μžμ‹ μ˜ κ°œμ„  절차(Improvement procedure) 자체λ₯Ό μˆ˜μ •ν•  수 μžˆλŠ”μ§€ μ—¬λΆ€. - [[Recursive Self-Improvement]] - μ—°κ²° 이유: μžκ°€ μ„€κ³„λŠ” μžκ°€ κ°œμ„ μ˜ ν•˜μœ„ μ§‘ν•©μœΌλ‘œ, 특히 '섀계(Design)'의 변경에 μ΄ˆμ μ„ 맞좀 [2, 3]. - 이 κ°œλ…μ„ 톡해 더 깊게 이해할 수 μžˆλŠ” λΆ€λΆ„: μ§€λŠ₯ 폭발의 이둠적 κ°€λŠ₯μ„±κ³Ό μ‹œμŠ€ν…œμ˜ μž¬κ·€μ  κ°•ν™” λ©”μ»€λ‹ˆμ¦˜. #### [관계 μœ ν˜• B: κ΅¬ν˜„/ν™œμš© 도ꡬ] - [[Darwin GΓΆdel Machine]] - μ—°κ²° 이유: μž¬κ·€μ  μžκ°€ μ„€κ³„μ˜ κ°€μž₯ 직접적인 μ‹€ν–‰ 사둀 [11, 24]. - 이 κ°œλ…μ„ 톡해 더 깊게 이해할 수 μžˆλŠ” λΆ€λΆ„: μ½”λ“œ 리포지토리λ₯Ό 직접 μˆ˜μ •ν•˜λŠ” μ—μ΄μ „νŠΈμ˜ μ§„ν™” 양상. - [[Meta-Learning]] - μ—°κ²° 이유: ν•™μŠ΅ 방법을 λ°°μš°λŠ” 메타 ν•™μŠ΅μ˜ 원리가 μžκ°€ 섀계 루프에 내포됨 [33, 34]. - 이 κ°œλ…μ„ 톡해 더 깊게 이해할 수 μžˆλŠ” λΆ€λΆ„: 적응 절차(Adaptation procedures)의 μ΅œμ ν™” 방식. ### 심측 후속 질문 (Deeper Research Questions) - μžκ°€ 섀계 κ³Όμ •μ—μ„œ μ—μ΄μ „νŠΈκ°€ μžμ‹ μ˜ 'Capacity for further modification(μΆ”κ°€ μˆ˜μ • λŠ₯λ ₯)'을 νŒŒκ΄΄ν•˜μ§€ μ•Šκ³  μœ μ§€ν•˜λŠ” 핡심 κΈ°μ œλŠ” 무엇인가? [35] - λͺ¨λΈ κ°€μ€‘μΉ˜κ°€ λ™κ²°λœ μƒνƒœμ—μ„œ μŠ€μΊν΄λ“œ μˆ˜μ •λ§ŒμœΌλ‘œ 얻을 수 μžˆλŠ” μ§€λŠ₯ ν–₯μƒμ˜ μƒν•œμ„ μ€ 어디인가? [21] - μžκ°€ μ„€κ³„λœ 도ꡬ듀 κ°„μ˜ 'κ΅¬ν˜„ μ„ΈλΆ€ 사항(Implementation details)'의 λ―Έμ„Έν•œ 차이가 μ™œ μ„±λŠ₯μ—μ„œ 큰 차이λ₯Ό λ§Œλ“œλŠ”κ°€? [36, 37] - 인간이 μ„€μ •ν•œ μ•ˆμ „ μ œμ•½ 쑰건($C_t$)이 AI의 μž¬κ·€μ  μžκ°€ μˆ˜μ •μ— μ˜ν•΄ 우회될 κ°€λŠ₯μ„±(Alignment drift)을 μ–΄λ–»κ²Œ μˆ˜ν•™μ μœΌλ‘œ λ°©μ–΄ν•  수 μžˆλŠ”κ°€? [22, 38] - μžκ°€ 섀계 루프 λ‚΄μ—μ„œ 'μ•„μΉ΄μ΄λΈŒ' 방식이 '그리디(Greedy)' 방식보닀 μš°μ›”ν•œ 근본적인 정보 이둠적 μ΄μœ λŠ” 무엇인가? [13] ### 싀무 적용 λ§₯락 (Practical Application Contexts) - **Implementation:** μ—μ΄μ „νŠΈμ˜ 초기 도ꡬ(Bash, Edit)λ₯Ό μ„€μ •ν•˜κ³ , μ„±λŠ₯ 둜그λ₯Ό 뢄석할 수 μžˆλŠ” 메타 μ—μ΄μ „νŠΈλ₯Ό λ°°μΉ˜ν•˜μ—¬ 1 to N ν™•μž₯을 μ‹œλ„ν•¨ [7]. - **System Design:** μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ„ λ‹¨μˆœν•œ ν…μŠ€νŠΈ ν”„λ‘¬ν”„νŠΈ 덩어리가 μ•„λ‹ˆλΌ, 검사 및 μˆ˜μ • κ°€λŠ₯ν•œ **μ½”λ“œ μ•„ν‹°νŒ©νŠΈ**λ“€μ˜ μ§‘ν•©μœΌλ‘œ 섀계해야 함 [3, 4]. - **Operation / Maintenance:** μžκ°€ μˆ˜μ •λœ μ½”λ“œμ˜ μ•ˆμ „μ„±μ„ 보μž₯ν•˜κΈ° μœ„ν•΄ μƒŒλ“œλ°•μŠ€ μ‹€ν–‰, μžλ™ν™”λœ λ‘€λ°±(Rollback), λΆˆλ³€ 감사 둜그(Immutable audit logs)λ₯Ό ν•„μˆ˜μ μœΌλ‘œ 톡합함 [18, 22, 39]. - **Learning Path:** μ‹œλ“œ μ—μ΄μ „νŠΈ AUTHORING -> μ„±λŠ₯ ν”Όλ“œλ°± μˆ˜μ§‘ -> 메타 μ—μ΄μ „νŠΈμ— μ˜ν•œ μ½”λ“œ λ³€ν˜• -> 검증 및 μ•„μΉ΄μ΄λΈŒ μ €μž₯의 μˆœν™˜ 과정을 ν•™μŠ΅ν•¨ [6, 8]. ### 인접 μ£Όλ³€ 주제 (Adjacent Topics) - [[Neurosymbolic AI]] - ν™•μž₯ λ°©ν–₯: 톡계적 ν•™μŠ΅(Neural)κ³Ό 상징적 μ œμ•½(Symbolic)을 κ²°ν•©ν•˜μ—¬ μžκ°€ μ„€κ³„μ˜ 논리적 정밀도λ₯Ό λ†’μ΄λŠ” λ°©ν–₯ [16, 40]. - [[AutoML]] - ν™•μž₯ λ°©ν–₯: κ³ μ •λœ 탐색 κ³΅κ°„μ—μ„œμ˜ μ΅œμ ν™” κΈ°μˆ μ„ μžκ°€ μ„€κ³„μ˜ 기초 λͺ¨λ“ˆλ‘œ ν™œμš© [33]. ## πŸ“ λ³€κ²½ 이λ ₯ (Change history) - 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine based on synthesized engineering evidence from MetaAI and DGM research [1, 22, 27].