wiki: Topic_Agent 신규 문서 일괄 추가 + ASTRA 성장 자산(인벤토리·reflections·장기기억) 동기화

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
2026-06-12 23:51:14 +09:00
parent 87040d3a1e
commit d77ff5c625
222 changed files with 17805 additions and 4 deletions
@@ -0,0 +1,106 @@
+---
+id: recursive-self-design
+title: "Recursive Self-Design"
+category: "10_Wiki/Topics"
+status: "draft"
+verification_status: "conceptual"
+canonical_id: ""
+aliases: ["자가 설계", "Recursive Source-code Improvement"]
+duplicate_of: ""
+source_trust_level: "B"
+confidence_score: 0.85
+created_at: 2026-06-12
+updated_at: 2026-06-12
+review_reason: ""
+merge_history: []
+tags: ["research", "self envolving"]
+raw_sources: ["NotebookLM Synthesis"]
+applied_in: ["https://github.com/jennyzzt/dgm", "https://github.com/DunLi-Tsinghua/MetaAI-Mini", "https://github.com/ShengranHu/ADAS", "https://github.com/SWE-agent/SWE-agent"]
+github_commit: ""
+---
+
+# [[Recursive Self-Design]]
+
+## 🎯 한 줄 통찰 (One-line insight)
+AI가 단순히 정해진 설계 공간 내에서 매개변수를 최적화하는 것을 넘어, 자신을 구축·평가·개선하는 메커니즘(도구, 워크플로우, 프롬프트 정책 등) 자체를 스스로 수정하고 확장하는 패러다임이다 [1-3].
+
+## 🧠 핵심 개념 (Core concepts)
+이 주제를 구성하는 4가지 운영 기준(Operational Criteria)은 다음과 같다 [3, 4]:
+1. **검사 가능한 대상 시스템 (Inspectable target system):** 아키텍처, 도구, 워크플로우, 프롬프트, 메모리 또는 코드 수준 정책을 검사하고 수정할 수 있는 대상 AI가 존재해야 함.
+2. **메타 수준 수정자 (Meta-level modifier):** 단순한 무작위 섭동이나 인간의 패치가 아닌, AI 기반 프로세스가 대상 시스템의 변경 사항을 제안함.
+3. **피드백 기반 선택 (Feedback-directed selection):** 제안된 변경 사항을 외부 작업이나 유틸리티 함수로 평가하고, 그 피드백이 후손 시스템의 유지 여부에 영향을 미침.
+4. **재귀적 지속성 (Recursive continuation):** 선택된 후손 시스템이 다음 단계의 개선을 위한 시작점이 되어 루프를 형성함.
+
+## 🧩 추출된 패턴 (Extracted patterns)
+- **Human Zero-to-One vs. AI One-to-N:** 인간은 시드(Seed) 시스템, 제약 조건, 평가 프로토콜 및 안전 경계를 정의(0 to 1)하고, AI는 이를 기반으로 구체적인 후손 설계안을 반복적으로 생성하고 확장(1 to N)한다 [5-8].
+- **경계 내부 최적화와 자가 설계의 분리:** 일반적인 최적화가 고정된 설계 공간($D_t$) 내에서 매개변수($x_t$)를 조정한다면, 재귀적 자가 설계는 전이 연산자($\Psi$)를 통해 설계 구조($S_t$) 자체를 변형한다 [9-11].
+- **아카이브 기반 진화:** 부모 에이전트가 자신의 벤치마크 로그를 분석하여 코드 수정을 제안하고, 성능이 입증된 후손만 아카이브에 저장하여 다양한 진화 경로를 보존한다 [8, 12, 13].
+
+## 📖 세부 내용 (Details)
+- **수학적 공식화:** 자가 설계 시스템의 구조적 구성 $S_{t+1} = \Psi(S_t, R_t, C_t)$ 로 표현되며, 여기서 $R_t$는 환경 피드백, $C_t$는 안전 제약 조건이다 [9, 10]. 
+- **코드 레벨의 스캐폴드 수정:** 현대의 파운데이션 모델은 대개 동결(Frozen)되어 있으므로, 자가 설계는 주로 모델 가중치가 아닌 에이전트의 **스캐폴드(Scaffold)**, 즉 도구 인터페이스, 컨텍스트 관리, 패치 순위 지정 워크플로우 등을 수정하는 데 집중한다 [3, 14-16].
+- **DGM(Darwin Gödel Machine)의 증거:** 시드 에이전트가 80회의 반복 수정을 거치며 가중치 변경 없이 SWE-bench Verified에서 20%에서 50%로, Polyglot에서 14.2%에서 30.7%로 성능을 향상시킨 사례가 보고되었다 [1, 17-19].
+- **구조적 개선의 구체적 양상:** [19, 20]
+    - **파일 뷰어 세분화:** 전체 파일 대신 관련 라인 범위만 조회하여 컨텍스트 부담 감소.
+    - **문자열 치환 편집:** 전체 파일 편집 대신 정밀한 하위 문자열 교체 방식 채택.
+    - **패치 검증 및 재시도:** 비어 있거나 테스트 전용인 패치를 감지하여 재시도 로직 가동.
+    - **컨텍스트 창 관리:** 한계 도달 시 대화 기록 요약 메커니즘 도입.
+
+## ⚖️ 모순 및 업데이트 (Contradictions & updates)
+- **가중치 동결의 한계:** 현재의 재귀적 자가 설계는 완전한 AGI나 지능 폭발을 증명한 것은 아니며, 주로 **동결된 파운데이션 모델** 위에서 코드 레벨의 도구와 워크플로우를 수정하는 수준에 머물러 있다 [14, 21, 22].
+- **탐험 vs 개선의 상충:** 공개된 절제 실험(Ablation) 결과에 따르면, 자가 설계 루프에서 '오픈 엔드 탐험(Open-ended exploration)'을 제거할 경우 성능이 대폭 하락(50% -> 23%)하며, 이는 단순한 성능 개선 시도보다 새로운 가능성을 찾는 탐험 과정이 필수적임을 시사한다 [18, 19, 23].
+
+## 🛠️ 적용 사례 (Applied in summary)
+- **DGM (Darwin Gödel Machine):** 코드 레벨 에이전트 스캐폴드, 편집 도구, 프롬프트 정책을 스스로 수정하는 시스템으로, GitHub 저장소 `https://github.com/jennyzzt/dgm`에 실험 아티팩트가 공개되어 있음 [11, 24-26].
+- **MetaAI-Mini:** 교육용 및 독립 실행을 위해 설계된 경량 재귀적 자가 설계 프로토콜로, HumanEval 데이터셋의 하위 집합을 사용하여 성능 향상 시에만 후보를 유지하는 루프를 구현함. 코드 위치: `https://github.com/DunLi-Tsinghua/MetaAI-Mini` [22, 27, 28].
+- **STOP (Self-Taught Optimizer):** 고정된 LLM을 사용하여 스캐폴딩 프로그램을 재귀적으로 개선하는 프레임워크 [29, 30].
+- **ADAS (Automated Design of Agentic Systems):** 메타 에이전트가 코드 레벨의 에이전트 설계를 탐색하는 시스템. 코드 위치: `https://github.com/ShengranHu/ADAS` [16, 25, 30, 31].
+
+## ✅ 검증 상태 및 신뢰도
+- **상태:** draft
+- **검증 단계:** conceptual (DGM 등의 시스템을 통해 실험적 증거가 확인되었으나, 일반화된 프레임워크로 확립 중인 단계)
+- **출처 신뢰도:** B (ArXiv 및 학계 연구 보고서 기반, 일부 시스템의 공개 코드 저장소 확인됨)
+- **중복 검사 결과:** 신규 생성 (New discovery)
+
+
+## 🔗 관련 문서 링크 (Related document links)
+
+### 상위/유사 개념
+
+#### [관계 유형 A: 아키텍처/기반 기술]
+- [[self-evolving agents]]
+  - 연결 이유: 자가 설계는 자가 진화 에이전트가 진화하는 구체적인 방법론 중 하나임 [2, 32].
+  - 이 개념을 통해 더 깊게 이해할 수 있는 부분: 에이전트가 자신의 개선 절차(Improvement procedure) 자체를 수정할 수 있는지 여부.
+- [[Recursive Self-Improvement]]
+  - 연결 이유: 자가 설계는 자가 개선의 하위 집합으로, 특히 '설계(Design)'의 변경에 초점을 맞춤 [2, 3].
+  - 이 개념을 통해 더 깊게 이해할 수 있는 부분: 지능 폭발의 이론적 가능성과 시스템의 재귀적 강화 메커니즘.
+
+#### [관계 유형 B: 구현/활용 도구]
+- [[Darwin Gödel Machine]]
+  - 연결 이유: 재귀적 자가 설계의 가장 직접적인 실행 사례 [11, 24].
+  - 이 개념을 통해 더 깊게 이해할 수 있는 부분: 코드 리포지토리를 직접 수정하는 에이전트의 진화 양상.
+- [[Meta-Learning]]
+  - 연결 이유: 학습 방법을 배우는 메타 학습의 원리가 자가 설계 루프에 내포됨 [33, 34].
+  - 이 개념을 통해 더 깊게 이해할 수 있는 부분: 적응 절차(Adaptation procedures)의 최적화 방식.
+
+### 심층 후속 질문 (Deeper Research Questions)
+- 자가 설계 과정에서 에이전트가 자신의 'Capacity for further modification(추가 수정 능력)'을 파괴하지 않고 유지하는 핵심 기제는 무엇인가? [35]
+- 모델 가중치가 동결된 상태에서 스캐폴드 수정만으로 얻을 수 있는 지능 향상의 상한선은 어디인가? [21]
+- 자가 설계된 도구들 간의 '구현 세부 사항(Implementation details)'의 미세한 차이가 왜 성능에서 큰 차이를 만드는가? [36, 37]
+- 인간이 설정한 안전 제약 조건($C_t$)이 AI의 재귀적 자가 수정에 의해 우회될 가능성(Alignment drift)을 어떻게 수학적으로 방어할 수 있는가? [22, 38]
+- 자가 설계 루프 내에서 '아카이브' 방식이 '그리디(Greedy)' 방식보다 우월한 근본적인 정보 이론적 이유는 무엇인가? [13]
+
+### 실무 적용 맥락 (Practical Application Contexts)
+- **Implementation:** 에이전트의 초기 도구(Bash, Edit)를 설정하고, 성능 로그를 분석할 수 있는 메타 에이전트를 배치하여 1 to N 확장을 시도함 [7].
+- **System Design:** 에이전트 시스템을 단순한 텍스트 프롬프트 덩어리가 아니라, 검사 및 수정 가능한 **코드 아티팩트**들의 집합으로 설계해야 함 [3, 4].
+- **Operation / Maintenance:** 자가 수정된 코드의 안전성을 보장하기 위해 샌드박스 실행, 자동화된 롤백(Rollback), 불변 감사 로그(Immutable audit logs)를 필수적으로 통합함 [18, 22, 39].
+- **Learning Path:** 시드 에이전트 AUTHORING -> 성능 피드백 수집 -> 메타 에이전트에 의한 코드 변형 -> 검증 및 아카이브 저장의 순환 과정을 학습함 [6, 8].
+
+### 인접 주변 주제 (Adjacent Topics)
+- [[Neurosymbolic AI]]
+  - 확장 방향: 통계적 학습(Neural)과 상징적 제약(Symbolic)을 결합하여 자가 설계의 논리적 정밀도를 높이는 방향 [16, 40].
+- [[AutoML]]
+  - 확장 방향: 고정된 탐색 공간에서의 최적화 기술을 자가 설계의 기초 모듈로 활용 [33].
+
+## 📝 변경 이력 (Change history)
+- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine based on synthesized engineering evidence from MetaAI and DGM research [1, 22, 27].