wiki: Topic_Agent 신규 문서 일괄 추가 + ASTRA 성장 자산(인벤토리·reflections·장기기억) 동기화

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
This commit is contained in:
Antigravity Agent
2026-06-12 23:51:14 +09:00
parent 87040d3a1e
commit d77ff5c625
222 changed files with 17805 additions and 4 deletions
@@ -0,0 +1,106 @@
---
id: recursive-self-design
title: "Recursive Self-Design"
category: "10_Wiki/Topics"
status: "draft"
verification_status: "conceptual"
canonical_id: ""
aliases: ["자가 설계", "Recursive Source-code Improvement"]
duplicate_of: ""
source_trust_level: "B"
confidence_score: 0.85
created_at: 2026-06-12
updated_at: 2026-06-12
review_reason: ""
merge_history: []
tags: ["research", "self envolving"]
raw_sources: ["NotebookLM Synthesis"]
applied_in: ["https://github.com/jennyzzt/dgm", "https://github.com/DunLi-Tsinghua/MetaAI-Mini", "https://github.com/ShengranHu/ADAS", "https://github.com/SWE-agent/SWE-agent"]
github_commit: ""
---
# [[Recursive Self-Design]]
## 🎯 한 줄 통찰 (One-line insight)
AI가 단순히 정해진 설계 공간 내에서 매개변수를 최적화하는 것을 넘어, 자신을 구축·평가·개선하는 메커니즘(도구, 워크플로우, 프롬프트 정책 등) 자체를 스스로 수정하고 확장하는 패러다임이다 [1-3].
## 🧠 핵심 개념 (Core concepts)
이 주제를 구성하는 4가지 운영 기준(Operational Criteria)은 다음과 같다 [3, 4]:
1. **검사 가능한 대상 시스템 (Inspectable target system):** 아키텍처, 도구, 워크플로우, 프롬프트, 메모리 또는 코드 수준 정책을 검사하고 수정할 수 있는 대상 AI가 존재해야 함.
2. **메타 수준 수정자 (Meta-level modifier):** 단순한 무작위 섭동이나 인간의 패치가 아닌, AI 기반 프로세스가 대상 시스템의 변경 사항을 제안함.
3. **피드백 기반 선택 (Feedback-directed selection):** 제안된 변경 사항을 외부 작업이나 유틸리티 함수로 평가하고, 그 피드백이 후손 시스템의 유지 여부에 영향을 미침.
4. **재귀적 지속성 (Recursive continuation):** 선택된 후손 시스템이 다음 단계의 개선을 위한 시작점이 되어 루프를 형성함.
## 🧩 추출된 패턴 (Extracted patterns)
- **Human Zero-to-One vs. AI One-to-N:** 인간은 시드(Seed) 시스템, 제약 조건, 평가 프로토콜 및 안전 경계를 정의(0 to 1)하고, AI는 이를 기반으로 구체적인 후손 설계안을 반복적으로 생성하고 확장(1 to N)한다 [5-8].
- **경계 내부 최적화와 자가 설계의 분리:** 일반적인 최적화가 고정된 설계 공간($D_t$) 내에서 매개변수($x_t$)를 조정한다면, 재귀적 자가 설계는 전이 연산자($\Psi$)를 통해 설계 구조($S_t$) 자체를 변형한다 [9-11].
- **아카이브 기반 진화:** 부모 에이전트가 자신의 벤치마크 로그를 분석하여 코드 수정을 제안하고, 성능이 입증된 후손만 아카이브에 저장하여 다양한 진화 경로를 보존한다 [8, 12, 13].
## 📖 세부 내용 (Details)
- **수학적 공식화:** 자가 설계 시스템의 구조적 구성 $S_{t+1} = \Psi(S_t, R_t, C_t)$ 로 표현되며, 여기서 $R_t$는 환경 피드백, $C_t$는 안전 제약 조건이다 [9, 10].
- **코드 레벨의 스캐폴드 수정:** 현대의 파운데이션 모델은 대개 동결(Frozen)되어 있으므로, 자가 설계는 주로 모델 가중치가 아닌 에이전트의 **스캐폴드(Scaffold)**, 즉 도구 인터페이스, 컨텍스트 관리, 패치 순위 지정 워크플로우 등을 수정하는 데 집중한다 [3, 14-16].
- **DGM(Darwin Gödel Machine)의 증거:** 시드 에이전트가 80회의 반복 수정을 거치며 가중치 변경 없이 SWE-bench Verified에서 20%에서 50%로, Polyglot에서 14.2%에서 30.7%로 성능을 향상시킨 사례가 보고되었다 [1, 17-19].
- **구조적 개선의 구체적 양상:** [19, 20]
- **파일 뷰어 세분화:** 전체 파일 대신 관련 라인 범위만 조회하여 컨텍스트 부담 감소.
- **문자열 치환 편집:** 전체 파일 편집 대신 정밀한 하위 문자열 교체 방식 채택.
- **패치 검증 및 재시도:** 비어 있거나 테스트 전용인 패치를 감지하여 재시도 로직 가동.
- **컨텍스트 창 관리:** 한계 도달 시 대화 기록 요약 메커니즘 도입.
## ⚖️ 모순 및 업데이트 (Contradictions & updates)
- **가중치 동결의 한계:** 현재의 재귀적 자가 설계는 완전한 AGI나 지능 폭발을 증명한 것은 아니며, 주로 **동결된 파운데이션 모델** 위에서 코드 레벨의 도구와 워크플로우를 수정하는 수준에 머물러 있다 [14, 21, 22].
- **탐험 vs 개선의 상충:** 공개된 절제 실험(Ablation) 결과에 따르면, 자가 설계 루프에서 '오픈 엔드 탐험(Open-ended exploration)'을 제거할 경우 성능이 대폭 하락(50% -> 23%)하며, 이는 단순한 성능 개선 시도보다 새로운 가능성을 찾는 탐험 과정이 필수적임을 시사한다 [18, 19, 23].
## 🛠️ 적용 사례 (Applied in summary)
- **DGM (Darwin Gödel Machine):** 코드 레벨 에이전트 스캐폴드, 편집 도구, 프롬프트 정책을 스스로 수정하는 시스템으로, GitHub 저장소 `https://github.com/jennyzzt/dgm`에 실험 아티팩트가 공개되어 있음 [11, 24-26].
- **MetaAI-Mini:** 교육용 및 독립 실행을 위해 설계된 경량 재귀적 자가 설계 프로토콜로, HumanEval 데이터셋의 하위 집합을 사용하여 성능 향상 시에만 후보를 유지하는 루프를 구현함. 코드 위치: `https://github.com/DunLi-Tsinghua/MetaAI-Mini` [22, 27, 28].
- **STOP (Self-Taught Optimizer):** 고정된 LLM을 사용하여 스캐폴딩 프로그램을 재귀적으로 개선하는 프레임워크 [29, 30].
- **ADAS (Automated Design of Agentic Systems):** 메타 에이전트가 코드 레벨의 에이전트 설계를 탐색하는 시스템. 코드 위치: `https://github.com/ShengranHu/ADAS` [16, 25, 30, 31].
## ✅ 검증 상태 및 신뢰도
- **상태:** draft
- **검증 단계:** conceptual (DGM 등의 시스템을 통해 실험적 증거가 확인되었으나, 일반화된 프레임워크로 확립 중인 단계)
- **출처 신뢰도:** B (ArXiv 및 학계 연구 보고서 기반, 일부 시스템의 공개 코드 저장소 확인됨)
- **중복 검사 결과:** 신규 생성 (New discovery)
## 🔗 관련 문서 링크 (Related document links)
### 상위/유사 개념
#### [관계 유형 A: 아키텍처/기반 기술]
- [[self-evolving agents]]
- 연결 이유: 자가 설계는 자가 진화 에이전트가 진화하는 구체적인 방법론 중 하나임 [2, 32].
- 이 개념을 통해 더 깊게 이해할 수 있는 부분: 에이전트가 자신의 개선 절차(Improvement procedure) 자체를 수정할 수 있는지 여부.
- [[Recursive Self-Improvement]]
- 연결 이유: 자가 설계는 자가 개선의 하위 집합으로, 특히 '설계(Design)'의 변경에 초점을 맞춤 [2, 3].
- 이 개념을 통해 더 깊게 이해할 수 있는 부분: 지능 폭발의 이론적 가능성과 시스템의 재귀적 강화 메커니즘.
#### [관계 유형 B: 구현/활용 도구]
- [[Darwin Gödel Machine]]
- 연결 이유: 재귀적 자가 설계의 가장 직접적인 실행 사례 [11, 24].
- 이 개념을 통해 더 깊게 이해할 수 있는 부분: 코드 리포지토리를 직접 수정하는 에이전트의 진화 양상.
- [[Meta-Learning]]
- 연결 이유: 학습 방법을 배우는 메타 학습의 원리가 자가 설계 루프에 내포됨 [33, 34].
- 이 개념을 통해 더 깊게 이해할 수 있는 부분: 적응 절차(Adaptation procedures)의 최적화 방식.
### 심층 후속 질문 (Deeper Research Questions)
- 자가 설계 과정에서 에이전트가 자신의 'Capacity for further modification(추가 수정 능력)'을 파괴하지 않고 유지하는 핵심 기제는 무엇인가? [35]
- 모델 가중치가 동결된 상태에서 스캐폴드 수정만으로 얻을 수 있는 지능 향상의 상한선은 어디인가? [21]
- 자가 설계된 도구들 간의 '구현 세부 사항(Implementation details)'의 미세한 차이가 왜 성능에서 큰 차이를 만드는가? [36, 37]
- 인간이 설정한 안전 제약 조건($C_t$)이 AI의 재귀적 자가 수정에 의해 우회될 가능성(Alignment drift)을 어떻게 수학적으로 방어할 수 있는가? [22, 38]
- 자가 설계 루프 내에서 '아카이브' 방식이 '그리디(Greedy)' 방식보다 우월한 근본적인 정보 이론적 이유는 무엇인가? [13]
### 실무 적용 맥락 (Practical Application Contexts)
- **Implementation:** 에이전트의 초기 도구(Bash, Edit)를 설정하고, 성능 로그를 분석할 수 있는 메타 에이전트를 배치하여 1 to N 확장을 시도함 [7].
- **System Design:** 에이전트 시스템을 단순한 텍스트 프롬프트 덩어리가 아니라, 검사 및 수정 가능한 **코드 아티팩트**들의 집합으로 설계해야 함 [3, 4].
- **Operation / Maintenance:** 자가 수정된 코드의 안전성을 보장하기 위해 샌드박스 실행, 자동화된 롤백(Rollback), 불변 감사 로그(Immutable audit logs)를 필수적으로 통합함 [18, 22, 39].
- **Learning Path:** 시드 에이전트 AUTHORING -> 성능 피드백 수집 -> 메타 에이전트에 의한 코드 변형 -> 검증 및 아카이브 저장의 순환 과정을 학습함 [6, 8].
### 인접 주변 주제 (Adjacent Topics)
- [[Neurosymbolic AI]]
- 확장 방향: 통계적 학습(Neural)과 상징적 제약(Symbolic)을 결합하여 자가 설계의 논리적 정밀도를 높이는 방향 [16, 40].
- [[AutoML]]
- 확장 방향: 고정된 탐색 공간에서의 최적화 기술을 자가 설계의 기초 모듈로 활용 [33].
## 📝 변경 이력 (Change history)
- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine based on synthesized engineering evidence from MetaAI and DGM research [1, 22, 27].