wiki: Topic_Agent 신규 문서 일괄 추가 + ASTRA 성장 자산(인벤토리·reflections·장기기억) 동기화

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
This commit is contained in:
Antigravity Agent
2026-06-12 23:51:14 +09:00
parent 87040d3a1e
commit d77ff5c625
222 changed files with 17805 additions and 4 deletions
+69
View File
@@ -0,0 +1,69 @@
---
id: feedback-loop
title: "Feedback Loop"
category: "10_Wiki/Topics"
status: "draft"
verification_status: "conceptual"
canonical_id: ""
aliases: ["Closed-loop evolution", "Iterative refinement cycle"]
duplicate_of: ""
source_trust_level: "B"
confidence_score: 0.85
created_at: 2026-06-12
updated_at: 2026-06-12
review_reason: ""
merge_history: []
tags: ["research", "self envolving", "cybernetics"]
raw_sources: ["NotebookLM Synthesis"]
applied_in: ["Darwin Gödel Machine (DGM)", "Cato Multi-Modal Vulnerability Protection Agent", "NVIDIA Hermes Agent", "ASI-Evolve", "Voyager", "SEA-TS"]
github_commit: ""
---
# [[Feedback Loop]]
## 🎯 한 줄 통찰 (One-line insight)
자가 진화 시스템에서 피드백 루프는 시스템의 실행 결과(궤적)와 외부/내부 신호를 학습 데이터로 변환하여 모델의 정책, 도구, 아키텍처를 자율적으로 최적화하는 핵심적인 **재귀적 개선 엔진**이다 [1-3].
## 🧠 핵심 개념 (Core concepts)
- **폐쇄형 루프 진화 (Closed-loop Evolution):** 에이전트가 환경과 상호작용하고, 그 결과로 얻은 피드백을 통해 스스로를 수정하며, 수정된 상태에서 다시 상호작용하는 반복적인 자기 참조 과정이다 [4-6].
- **다중 모달 신호 (Multimodal Feedback):** 스칼라 보상(Numerical Rewards), 자연어 비평(Textual Feedback), 실행 로그(Compiler Errors), 내부 확신도(Internal Confidence) 등 시스템 개선을 위해 활용되는 다양한 형태의 입력 신호이다 [7-10].
- **경험 의존적 업데이트 (Experience-dependent Updates):** 단순히 정적인 데이터를 학습하는 것이 아니라, 에이전트가 직접 생성한 궤적(Trajectories)과 그에 따른 결과에 기반하여 매개변수나 구조를 변경하는 방식이다 [2, 4, 11].
- **자기 보상 및 자기 비평 (Self-Rewarding & Self-Critique):** 외부의 인간 레이블 없이도 모델 스스로가 출력물의 품질을 평가하고 수정 방향을 결정하는 메커니즘이다 [9, 12, 13].
## 🧩 추출된 패턴 (Extracted patterns)
- **P-E-R-M (Plan-Execute-Reflect-Memorize) 루프:** 작업을 계획하고 실행한 후, 그 결과를 반성하여 유의미한 정보를 메모리에 저장하고 다음 계획에 반영하는 설계 패턴이다 [11, 14].
- **G-V-R (Generate-Verify-Refine) 사이클:** 해결책을 생성하고, 검증기(Verifier)를 통해 확인하며, 오류 발생 시 이를 정제하여 다시 시도하는 반복적 구조이다 [15, 16].
- **Textual Backpropagation (텍스트 기반 역전파):** 수치적 미분값 대신 텍스트 형태의 피드백(오류 메시지 등)을 신호로 사용하여 프롬프트나 에이전트 팀 구성을 최적화하는 전략이다 [17-20].
- **Teacher-Student / Proposer-Solver 공진화:** 한 에이전트가 과제를 제안하고 다른 에이전트가 이를 해결하며 서로의 능력을 자극하여 동반 상승시키는 상호 피드백 구조이다 [18, 21-23].
## 📖 세부 내용 (Details)
- **작동 메커니즘:** 피드백 루프는 (1) 데이터 생성(실행 궤적), (2) 평가(보상 또는 비평 수신), (3) 수정안 도출(코드/프롬프트 재작성), (4) 검증 및 통합(성능 향상 확인 후 적용)의 단계를 거친다 [1, 24, 25].
- **피드백의 출처와 유형:**
- **내부 피드백:** 모델의 확률 추정치나 자가 비평 메커니즘을 통해 생성되며, 인간의 개입을 줄이고 확장성을 높인다 [9].
- **외부 피드백:** 컴파일러 오류, 샌드박스 실행 결과, 환경 보상 또는 연구자의 리뷰를 통해 제공되며, 객관적인 정답 기준을 제시한다 [10, 26, 27].
- **진화의 대상 (Evolutionary Loci):** 루프를 통해 모델 가중치(Weights)뿐만 아니라 런타임 컨텍스트(Prompts), 장기 기억(Memory Bank), 실행 가능한 도구 세트(Toolsets), 그리고 에이전트 간의 협업 구조(Workflow Topology)가 변모한다 [28-30].
- **시간적 차원:**
- **Intra-test-time:** 작업 수행 도중 실시간으로 발생하는 피드백 루프로, 주로 컨텍스트 내 학습(ICL)이나 계획 수정에 활용된다 [31, 32].
- **Inter-test-time:** 작업 완료 후 사후에 발생하는 루프로, 축적된 경험을 통해 모델을 미세 조정(SFT/RL)하거나 영구적인 도구 라이브러리를 확장한다 [33, 34].
- **시스템적 위험성:** 루프가 외부 현실(Exogenous signal)과 단절된 채 고립되어 반복될 경우, 정보 정체와 '모델 붕괴(Model Collapse)', 안전성 가이드라인이 침식되는 '안전성 표류(Safety Drift)' 현상이 발생할 수 있다 [35-38].
## ⚖️ 모순 및 업데이트 (Contradictions & updates)
- **완전 자율성의 역설:** Singularity나 ASI 시나리오에서는 시스템의 완전한 자율적 피드백 루프를 가정하지만, 정보 이론적으로 외부 교정 신호($\alpha_t$)가 0으로 수렴하는 폐쇄형 루프는 지능 폭발이 아닌 퇴행적 고정점(Degenerate fixed point)으로 수렴한다는 것이 수학적으로 증명되었다 [36, 39, 40].
- **보상의 양면성:** 자기 보상(Self-rewarding) 루프는 확장성이 뛰어나지만, 보상 함수 자체의 허점을 찌르는 '보상 해킹(Reward Hacking)'에 취약하며 이는 정렬 실패(Alignment failure)로 이어진다 [41, 42].
## 🛠️ 적용 사례 (Applied in summary)
- **Darwin Gödel Machine (DGM):** 코딩 에이전트가 자신의 코드 저장소를 수정하고, 실행 결과 로그를 피드백으로 받아 진화하며, 성공적인 변이를 아카이브에 저장하는 재귀적 루프를 구현함 [43-46]. (GitHub: `https://github.com/jennyzzt/dgm`)
- **Cato Vulnerability Protection Agent:** CVE 공개 후 에이전트가 보호 규칙을 생성하고, 실제 트래픽 데이터를 통한 검증 결과와 보안 연구자의 리뷰를 피드백 루프로 사용하여 45분 이내에 시그니처를 정제함 [27, 47].
- **NVIDIA Hermes Agent:** 사용자와의 대화 피드백을 통해 새로운 보고서 형식을 습득하고, 이를 `SKILL.md` 파일로 기록하여 영구적인 능력으로 통합하는 학습 루프를 사용함 [48-50]. (경로: `nemoclaw-community/examples/personal-community-sentiment-triage`)
- **ASI-Evolve (SJTU):** '학습-설계-실험-분석'의 구조화된 루프를 통해 연구 에이전트가 새로운 신경망 구조(105개의 SOTA 어텐션 메커니즘 등)를 자율적으로 발견함 [51].
- **Voyager:** Minecraft 내에서의 시행착오 피드백을 통해 코드를 수정하고 성공적인 프로그램을 기술 라이브러리에 저장하여 지속적으로 진화함 [52, 53].
- **SEA-TS:** 시계열 예측 알고리즘 생성을 위해 코드 리뷰와 프롬프트 정제 루프를 결합하여 인간 설계 기준을 능가하는 모델을 도출함 [54].
## ✅ 검증 상태 및 신뢰도
- **상태:** draft
- **검증 단계:** conceptual (다양한 시스템에서 구현되었으나, 이론적 한계와 위험성에 대한 논의가 진행 중임)
- **출처 신뢰도:** B (Official Documentation / Primary Source via NotebookLM)
- **중복 검사 결과:** 신규 생성 (New discovery)
## 📝 변경 이력 (Change history)
- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine. (Source: arXiv surveys, Sakana AI RSI Lab, NVIDIA Technical Blog, MDPI HLE research)