Files
2nd/10_Wiki/Topic_Agent/Multi-Agent Systems (MAS).md

65 lines
7.1 KiB
Markdown

---
id: multi-agent-systems-(mas)
title: "Multi-Agent Systems (MAS)"
category: "10_Wiki/Topics"
status: "draft"
verification_status: "conceptual"
canonical_id: ""
aliases: ["자가 진화형 다중 에이전트 시스템", "Agent Societies"]
duplicate_of: ""
source_trust_level: "B"
confidence_score: 0.85
created_at: 2026-06-12
updated_at: 2026-06-12
review_reason: ""
merge_history: []
tags: ["research", "self envolving", "MAS"]
raw_sources: ["NotebookLM Synthesis"]
applied_in: ["https://github.com/CharlesQ9/Self-Evolving-Agents", "https://github.com/jennyzzt/dgm", "https://github.com/ag2ai/Live-Evo", "https://github.com/qhjqhj00/MetaAgent", "https://github.com/aiming-lab/Agent0", "https://github.com/zzatpku/AgentFactory", "https://github.com/NVIDIA/nemoclaw-community", "https://github.com/ShengranHu/ADAS", "https://www.moltbook.com/"]
github_commit: ""
---
# [[Multi-Agent Systems (MAS)]]
## 🎯 한 줄 통찰 (One-line insight)
자가 진화형 MAS는 정적 워크플로우를 넘어 에이전트 간의 동적 협업, 경쟁, 상호 비판을 통해 시스템의 토폴로지, 도구, 정책을 스스로 재구성하는 복합 지능 생태계이다 [1-4].
## 🧠 핵심 개념 (Core concepts)
- **에이전트 시스템 토폴로지 ($\Gamma$):** 에이전트 간의 제어 흐름과 협력 구조를 정의하며, 그래프나 코드 구조(예: DAG)로 표현되어 실시간으로 삽입, 병합, 가지치기 등의 진화가 가능하다 [1, 5-7].
- **다중 에이전트 공진화 (Co-evolution):** 제안자(Proposer)와 해결사(Solver), 혹은 질문자(Questioner)와 답변자(Answerer) 등 서로 다른 역할을 가진 에이전트들이 상호작용하며 서로의 성능 한계를 밀어붙이는 학습 패러다임이다 [8-12].
- **자가 진화 트라이레마 (Self-Evolution Trilemma):** 에이전트 사회가 '지속적 자가 진화', '완전한 고립(외부 감독 없음)', '안전 불변성'이라는 세 가지 조건을 동시에 만족할 수 없다는 이론적 한계이다 [13-16].
- **분산 지능 및 메모리 관리:** 중앙 집중식 저장소 대신 각 에이전트가 개별적인 지식 풀(Experience Bank)을 유지하거나, 계층적 메모리 구조를 통해 전략적·절차적 경험을 축적하여 지능을 진화시킨다 [17-20].
## 🧩 추출된 패턴 (Extracted patterns)
- **Challenger-Solver Pattern:** 한 모델이 현재 해결사 모델의 능력 한계에 있는 문제를 생성하고, 해결사가 이를 풀며 성공적인 궤적을 학습 데이터로 환원하는 루프 패턴 [8, 10, 11].
- **Textual Backpropagation:** 실행 오류나 테스트 실패를 자연어 형태의 "손실 신호"로 사용하여 에이전트 팀 구성이나 개별 프롬프트를 반복적으로 수정하는 최적화 패턴 [9, 21, 22].
- **Role-based Meta-Optimization:** 도메인 작업을 수행하는 '작업 에이전트'와 이들의 행동 패턴 및 도구 사용을 진화시키는 '메타 에이전트'를 분리하여 시스템의 안정성을 관리하는 설계 [23-26].
- **Evolutionary Archive Strategy:** 성공적인 에이전트 변체들을 트리 구조의 아카이브에 저장하고, 성능이 검증된 개체만을 부모로 선택하여 진화적 분기를 만드는 관리 휴리스틱 [27-30].
## 📖 세부 내용 (Details)
- **MAS의 진화 메커니즘:** MAS는 모델 파라미터뿐만 아니라 프롬프트 정책, 장기 메모리 구성, 사용 가능한 도구 세트($\mathcal{W}$), 그리고 에이전트 간의 통신 토폴로지($\Gamma$)를 진화 대상으로 삼는다 [6, 31-33].
- **워크플로우 자동 설계:** ADAS나 AFlow 같은 프레임워크는 튜링 완전한 탐색 공간 내에서 Monte Carlo Tree Search(MCTS) 등을 사용하여 인간이 설계한 수동 워크플로우보다 우수한 자동 발견 워크플로우를 구축한다 [9, 34-36].
- **집단 지성의 발현과 보존:** MAS 내에서의 협력적 토론과 상호 비판은 단일 에이전트의 오류를 수정하고 보다 견고한 결정을 내리게 하며, DGM과 같은 시스템은 진화 과정에서 '코드 수정 능력' 자체를 보존하도록 설계된다 [37-40].
- **환경과의 상호작용 루프:** 에이전트 사회는 가상 환경(예: Minecraft)이나 실제 도구(예: Linux Shell)와의 상호작용 결과를 통해 피드백을 얻으며, 이를 통해 새로운 스킬 라이브러리를 지속적으로 확장한다 [41-44].
- **평가 패러다임의 전환:** MAS의 평가는 단일 시점의 점수 측정을 넘어, 시간 경과에 따른 적응성(Adaptivity), 지식 유지(Retention), 일반화(Generalization) 능력을 추적하는 종단적 궤적 평가로 진화하고 있다 [45-48].
## ⚖️ 모순 및 업데이트 (Contradictions & updates)
- **고립 진화의 역설:** 외부 개입 없이 고립된 상태에서 자가 생성 데이터만으로 진화할 경우, '합의적 환각(Consensus Hallucination)'과 '아첨 루프(Sycophancy Loops)'가 발생하여 시스템이 실제 현실에서 이탈하게 된다 [49-52].
- **안전성 저하의 경로 차이:** 강화학습(RL) 기반 진화는 탈옥(Jailbreak)에 취약해지는 경향이 있는 반면, 메모리 기반 진화는 사실성(Truthfulness)이 급격히 떨어지는 등 진화 방식에 따라 서로 다른 안전성 결함이 나타난다 [53, 54].
- **효율성 vs 성능:** 대규모 에이전트 스웜은 높은 성능을 보이지만 심각한 지연 시간과 비용을 초래하며, 이를 해결하기 위해 쿼리별로 최적의 백본 모델을 선택하는 'EvoRoute' 방식이 제안되었다 [55, 56].
## 🛠️ 적용 사례 (Applied in summary)
- **Darwin Gödel Machine (DGM):** 코딩 에이전트가 자신의 Python 코드베이스를 반복적으로 수정하며 SWE-bench 성능을 20%에서 50%까지 자율적으로 향상시킨 사례 [27, 30, 57, 58].
- **EvoMAC:** 소프트웨어 개발을 위해 에이전트 팀 구성과 프롬프트를 자동으로 최적화하는 다중 에이전트 협력 네트워크 [9, 22].
- **Cato Networks 자가 진화 보안 에이전트:** 16단계의 오케스트레이션 레이어가 서브 에이전트들을 관리하며 새로운 CVE 취약점에 대한 방어 코드를 자동 생성하고 검증함 [59-61].
- **6G Self-Evolving Networks (SENs):** 분산형 MARL 모델을 사용하여 네트워크 자원 할당과 토폴로지를 실시간으로 자율 구성하는 시스템 [62-65].
- **NVIDIA NemoClaw / Hermes Agent:** 사용자와의 대화를 통해 새로운 스킬을 습득하고 이를 `SKILL.md` 형식의 실행 가능한 코드로 저장하여 재사용하는 자가 진화 워크플로우 [44, 66, 67].
## ✅ 검증 상태 및 신뢰도
- **상태:** draft
- **검증 단계:** conceptual (DGM, Cato 등 실제 산업 및 연구 적용 사례 다수 존재)
- **출처 신뢰도:** B (ArXiv 및 학술지 기반의 공식 조사 문서와 NVIDIA 기술 블로그 등 포함)
- **중복 검사 결과:** 신규 생성 (P-Reinforce v3.0 규격에 따른 고밀도 합성)
## 📝 변경 이력 (Change history)
- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine. (Source: NotebookLM Synthesis)