d77ff5c625
Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
62 lines
5.9 KiB
Markdown
62 lines
5.9 KiB
Markdown
---
|
|
id: meta-agent
|
|
title: "Meta-Agent"
|
|
category: "10_Wiki/Topics"
|
|
status: "draft"
|
|
verification_status: "conceptual"
|
|
canonical_id: ""
|
|
aliases: ["메타 에이전트", "Hyperagent", "Meta-level modifier"]
|
|
duplicate_of: ""
|
|
source_trust_level: "B"
|
|
confidence_score: 0.85
|
|
created_at: 2026-06-12
|
|
updated_at: 2026-06-12
|
|
review_reason: ""
|
|
merge_history: []
|
|
tags: ["research", "self envolving"]
|
|
raw_sources: ["NotebookLM Synthesis"]
|
|
applied_in: ["https://github.com/CharlesQ9/Self-Evolving-Agents", "https://github.com/jennyzzt/dgm", "https://github.com/DunLi-Tsinghua/MetaAI-Mini"]
|
|
github_commit: ""
|
|
---
|
|
|
|
# [[Meta-Agent]]
|
|
|
|
## 🎯 한 줄 통찰 (One-line insight)
|
|
도메인 작업을 수행하는 '테스크 에이전트'와 그 행동 지침 및 개선 프로세스 자체를 수정하는 '메타 에이전트'의 분리를 통해 시스템의 자기 설계를 구현하는 고차원 자율 컴퓨팅 개체 [1, 2].
|
|
|
|
## 🧠 핵심 개념 (Core concepts)
|
|
- **재귀적 자기 설계 (Recursive Self-Design):** 에이전트의 아키텍처, 도구 체인, 프롬프트 정책 및 코드 수준의 메커니즘을 스스로 수정하여 미래의 행동 방식을 재구성하는 과정 [3, 4].
|
|
- **메타 레벨 수정자 (Meta-level Modifier):** 단순한 매개변수 조정을 넘어 타겟 시스템에 대한 구조적 변경을 제안하고 실행하는 AI 기반의 프로세스 [5, 6].
|
|
- **테스크-메타 에이전트 분리 (Task & Meta Agent Decoupling):** 도메인 업무 수행(Task Agent)과 시스템의 행동 수정(Meta-Agent) 역할을 분리하여, 자기 수정 루프가 핵심 안전 제약 조건을 직접 파괴하지 못하도록 보호하는 구조 [1, 2].
|
|
- **메타 학습 및 인지 (Meta-learning & Meta-cognition):** 에이전트가 자신의 역량 격차를 탐지하고, 해결책뿐만 아니라 검색 및 적응 휴리스틱 자체를 진화시키는 능력 [7, 8].
|
|
|
|
## 🧩 추출된 패턴 (Extracted patterns)
|
|
- **관찰-진단-수정 루프:** 실패 로그를 분석하여 루트 원인을 식별하고, 이에 대응하는 구성을 제안하며, 검증 후 이를 시스템에 반영하는 폐쇄형 피드백 루프 [9, 10].
|
|
- **아카이브 기반 계통 진화:** 성공적인 변종 에이전트들을 아카이브에 저장하고, 이를 부모로 삼아 새로운 자식 에이전트를 생성하는 인공 선택(Artificial Selection) 전략 [10, 11].
|
|
- **소스 수준 재작성 (Source-level Rewriting):** 텍스트 수정을 넘어 에이전트의 실행 엔진인 소스 코드를 직접 수정하여 물리적인 아키텍처 한계를 극복하는 방식 [12, 13].
|
|
|
|
## 📖 세부 내용 (Details)
|
|
- **구조적 차별성:** 일반적인 최적화(Boundary-internal Optimization)가 고정된 설계 공간 내에서 매개변수를 조정하는 반면, 메타 에이전트 기반의 재귀적 자기 설계는 에이전트 설계($S_t$) 자체를 변환 연산자($\Psi$)를 통해 새로운 상태($S_{t+1}$)로 전이시킨다 [4, 14].
|
|
- **Hyperagents (DGM-H):** Meta(FAIR) 등에서 제안된 개념으로, 도메인 작업을 수행하는 에이전트와 이들을 수정하는 메타 에이전트를 하나의 편집 가능한 프로그램 내에 통합하여 메타 인지적 자기 수정을 가능케 한다 [2, 15].
|
|
- **적응형 메모리 진화 (MemEvolve):** 에이전트의 지식 데이터뿐만 아니라 메모리 시스템의 아키텍처(인코딩, 저장, 검색 로직) 자체를 특정 도메인에 맞게 최적화하는 메타 진화 프레임워크를 운용한다 [12, 16].
|
|
- **실시간 워크플로 구축:** FlowReasoner와 같은 시스템은 메타 에이전트를 강화 학습으로 훈련시켜 각 쿼리에 최적화된 맞춤형 워크플로를 즉석에서 생성하도록 한다 [17].
|
|
- **안전 제약 조건:** 메타 에이전트가 제안한 수정 사항은 반드시 불변의 안전 기준(Immutable Safety Criteria)에 대해 검증되어야 하며, 성능 퇴보 시 즉시 이전의 안정적인 상태로 되돌리는 롤백 프로토콜이 수반된다 [1, 18].
|
|
|
|
## ⚖️ 모순 및 업데이트 (Contradictions & updates)
|
|
- **자율성의 역설:** 시스템이 완전한 자율성을 가질수록(외적 신호 $\alpha_t \to 0$), 외부의 정답 신호가 사라져 엔트로피 붕괴(Entropy Decay)나 분산 증폭으로 인한 지능의 퇴보가 발생할 수 있다는 이론적 한계가 지적된다 [19, 20].
|
|
- **최적화 vs 설계:** 단순한 프롬프트 최적화 시스템과 메타 에이전트를 통한 구조적 자기 설계 시스템 간의 경계가 모호할 수 있으나, 소스 데이터는 '에이전트가 자신의 개선 절차를 수정할 수 있는지' 여부를 중요한 구분점으로 본다 [3, 21].
|
|
|
|
## 🛠️ 적용 사례 (Applied in summary)
|
|
- **Darwin Gödel Machine (DGM):** 코딩 에이전트가 자신의 Python 코드베이스를 재귀적으로 수정하여 성능을 개선하는 시스템으로, 80회 반복 후 SWE-bench에서 성능이 20%에서 50%로 향상됨 [22, 23].
|
|
- **ASI-Evolve:** 연구 파이프라인 전체를 자동화하며, 'Researcher' 에이전트가 후보 코드를 제안하고 'Engineer' 에이전트가 이를 실행 및 분석하여 지식 베이스를 업데이트함 [24, 25].
|
|
- **Cato Networks 보안 에이전트:** 16단계의 하위 에이전트를 조정하는 오케스트레이션 레이어를 통해 취약점 탐지부터 보호 서명 생성까지의 과정을 자율적으로 진화시킴 [26, 27].
|
|
- **MetaAI-Mini:** HumanEval 데이터셋을 활용하여 메타 에이전트의 재귀적 설계를 실험할 수 있는 최소한의 재현 가능 프로토콜 [28, 29].
|
|
|
|
## ✅ 검증 상태 및 신뢰도
|
|
- **상태:** draft
|
|
- **검증 단계:** conceptual (실제 적용 사례 발견 시 applied/validated로 승격 가능)
|
|
- **출처 신뢰도:** B (Official Documentation / Primary Source via NotebookLM)
|
|
- **중복 검사 결과:** 신규 생성 (New discovery)
|
|
|
|
## 📝 변경 이력 (Change history)
|
|
- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine. |