--- id: multi-agent-system title: "Multi-Agent System" category: "10_Wiki/Topics" status: "draft" verification_status: "conceptual" canonical_id: "" aliases: ["MAS", "Agent Societies", "Multi-Agent Evolution"] duplicate_of: "" source_trust_level: "B" confidence_score: 0.85 created_at: 2026-06-12 updated_at: 2026-06-12 review_reason: "" merge_history: [] tags: ["research", "self envolving", "multi-agent"] raw_sources: ["NotebookLM Synthesis"] applied_in: ["https://github.com/CharlesQ9/Self-Evolving-Agents", "https://github.com/ag2ai/Live-Evo", "https://github.com/qhjqhj00/MetaAgent", "https://github.com/aiming-lab/SimpleMem", "https://github.com/zzatpku/AgentFactory", "https://github.com/aiming-lab/Agent0", "https://github.com/ShaoShuai0605/Misevolution", "https://github.com/aiming-lab/ATP", "https://github.com/chenxu2-gif/TacoMAS-MultiAgent", "https://github.com/cf3i/SocialSystemArena", "https://github.com/zikuicai/aegisllm", "https://github.com/tmlr-group/AlphaApollo", "https://github.com/ShengranHu/ADAS", "https://github.com/SWE-agent/SWE-agent", "https://github.com/jennyzzt/dgm", "https://github.com/NVIDIA/nemoclaw-community", "policy.yaml", "PCT/EP2025/080977"] github_commit: "" --- # [[Multi-Agent System]] ## 🎯 ν•œ 쀄 톡찰 (One-line insight) **Multi-Agent System(MAS)**은 κ°œλ³„ μ—μ΄μ „νŠΈμ˜ μ§€λŠ₯을 λ„˜μ–΄, 동적인 ν˜‘λ ₯ ν† ν΄λ‘œμ§€, 곡유 지식 베이슀, μƒν˜Έ ν”Όλ“œλ°± 루프λ₯Ό 톡해 슀슀둜의 ꡬ쑰와 정책을 μž¬μ„€κ³„ν•˜λ©° 집단 μ§€λŠ₯을 μ§„ν™”μ‹œν‚€λŠ” 자율적 μ—μ΄μ „νŠΈ μ‚¬νšŒμ΄λ‹€ [1-3]. ## 🧠 핡심 κ°œλ… (Core concepts) - **μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œ 곡식화 ($\Pi$):** μ‹œμŠ€ν…œμ€ ν† ν΄λ‘œμ§€($\Gamma$), λͺ¨λΈ($\psi$), μ»¨ν…μŠ€νŠΈ/λ©”λͺ¨λ¦¬($C$), 도ꡬ μ§‘ν•©($\mathcal{W}$)의 νŠœν”Œ $\Pi = (\Gamma, \{\psi_i\}, \{C_i\}, \{\mathcal{W}_i\})$둜 μ •μ˜λœλ‹€ [2, 4]. - **에이전틱 μ›Œν¬ν”Œλ‘œ μ΅œμ ν™” (Agentic Workflow Optimization):** κ³ μ •λœ ꡬ쑰λ₯Ό λ„˜μ–΄ Monte Carlo Tree Search(MCTS) 등을 ν™œμš©ν•˜μ—¬ λ³΅μž‘ν•œ 문제 해결에 μ΅œμ ν™”λœ μ—μ΄μ „νŠΈ κ°„ 톡신 및 ν˜‘λ ₯ ꡬ쑰λ₯Ό νƒμƒ‰ν•˜κ³  κ°œμ„ ν•œλ‹€ [5-7]. - **닀쀑 μ—μ΄μ „νŠΈ κ°•ν™” ν•™μŠ΅ (MARL):** μ—¬λŸ¬ μ—μ΄μ „νŠΈκ°€ μƒν˜Έμž‘μš©ν•˜λ©° κ°œλ³„ 및 집단 보상을 μ΅œλŒ€ν™”ν•˜κΈ° μœ„ν•΄ λ‚΄λΆ€ 행동 정책을 κ³΅λ™μœΌλ‘œ μ§„ν™”μ‹œν‚¨λ‹€ [8-10]. - **μ‹œμŠ€ν…œ μ•„ν‚€ν…μ²˜ μ§„ν™” (System Architecture Evolution):** 였λ₯˜ μ‹ ν˜Έλ₯Ό 기반으둜 μ—μ΄μ „νŠΈ νŒ€ ꡬ성, μ—­ν•  μ •μ˜, μ›Œν¬ν”Œλ‘œλ₯Ό λ™μ μœΌλ‘œ μˆ˜μ •ν•˜λŠ” "ν…μŠ€νŠΈ μ—­μ „νŒŒ(Textual Backpropagation)" λ©”μ»€λ‹ˆμ¦˜μ„ ν¬ν•¨ν•œλ‹€ [11, 12]. ## 🧩 μΆ”μΆœλœ νŒ¨ν„΄ (Extracted patterns) - **ν”ΌλΌλ―Έλ“œ ꡬ쑰의 DAG ν† ν΄λ‘œμ§€:** μ—μ΄μ „νŠΈλ₯Ό Directed Acyclic Graph(DAG) ν˜•νƒœλ‘œ λ°°μΉ˜ν•˜κ³  병λͺ© ν˜„μƒ 감지 μ‹œ λ…Έλ“œλ₯Ό λ™μ μœΌλ‘œ μ‚½μž…, 병합 λ˜λŠ” μ œκ±°ν•˜μ—¬ ꡬ쑰λ₯Ό μ§„ν™”μ‹œν‚¨λ‹€ [13, 14]. - **ν† λ„ˆλ¨ΌνŠΈ 기반 선택 (ELO Selection):** μ—μ΄μ „νŠΈ 변쒅듀을 μƒμ„±ν•˜κ³  μƒν˜Έ λŒ€κ²°(ELO μŠ€μ½”μ–΄ 기반)을 톡해 κ°€μž₯ μš°μˆ˜ν•œ μ „λž΅κ³Ό ꡬ쑰λ₯Ό κ°€μ§„ μ—μ΄μ „νŠΈλ₯Ό μ„ λ°œν•˜μ—¬ μ•„μΉ΄μ΄λΈŒμ— μœ μ§€ν•œλ‹€ [13, 15]. - **Maxwell's Demon 검증 μ „λž΅:** μ—μ΄μ „νŠΈκ°€ μƒμ„±ν•œ 데이터가 ν•™μŠ΅ 루프에 λ“€μ–΄κ°€κΈ° μ „, μ™ΈλΆ€ 검증기(κ·œμΉ™ 기반 λ˜λŠ” Human-in-the-loop)λ₯Ό 톡해 κ³ μ—”νŠΈλ‘œν”Ό(μœ ν•΄ν•˜κ±°λ‚˜ ν—ˆκ΅¬μ μΈ) 데이터λ₯Ό ν•„ν„°λ§ν•œλ‹€ [16, 17]. - **지식 및 메타 κ°€μ΄λ“œλΌμΈ 뱅크:** 원본 κ²½ν—˜ 데이터와 이λ₯Ό μ •μ œν•œ 절차적 κ·œμΉ™μ„ 뢄리 μ €μž₯ν•˜μ—¬ 도메인 변화에 μœ μ—°ν•˜κ²Œ λŒ€μ‘ν•œλ‹€ [18, 19]. ## πŸ“– μ„ΈλΆ€ λ‚΄μš© (Details) - **MAS의 μ§„ν™” λ°©ν–₯μ„±:** - **μ›Œν¬ν”Œλ‘œ μ΅œμ ν™”:** μžμ—°μ–΄ λͺ…λ ΉμœΌλ‘œλΆ€ν„° μ„ ν˜• λ˜λŠ” κ·Έλž˜ν”„ 기반 μ›Œν¬ν”Œλ‘œλ₯Ό μžλ™ μƒμ„±ν•˜κ³ , μ‹€ν–‰ κ²°κ³Όλ₯Ό λ°”νƒ•μœΌλ‘œ 기호적 ν•™μŠ΅(Symbolic Learning)을 톡해 κ·œμΉ™μ„ λ„μΆœν•œλ‹€ [20, 21]. - **자율 μ—μ΄μ „νŠΈ μ΅œμ ν™”:** μ—μ΄μ „νŠΈκ°€ μžμ‹ μ˜ μ†ŒμŠ€ μ½”λ“œλ₯Ό 직접 μˆ˜μ •ν•˜κ±°λ‚˜(Darwin GΓΆdel Machine), ν•˜μ΄λ ˆλ²¨ μ•„ν‚€ν…μ²˜ "청사진"을 ν•™μŠ΅ κ°€λŠ₯ν•œ ꡬ성 μš”μ†Œλ‘œ μ·¨κΈ‰ν•˜μ—¬ μ‘°ν•©ν•œλ‹€ [22, 23]. - **닀쀑 μ—μ΄μ „νŠΈ ν˜‘λ ₯ 가속기:** - **DecentMem:** 곡유 λ©”λͺ¨λ¦¬μ˜ 톡신 μ˜€λ²„ν—€λ“œμ™€ λ‹€μ–‘μ„± λΆ•κ΄΄λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 각 μ—μ΄μ „νŠΈκ°€ 독립적인 탐색/μ°©μ·¨ λ©”λͺ¨λ¦¬ 풀을 μœ μ§€ν•˜λŠ” λΆ„μ‚° λ©”λͺ¨λ¦¬ ν”„λ ˆμž„μ›Œν¬μ΄λ‹€ [24]. - **TacoMAS:** ν…ŒμŠ€νŠΈ μ‹œκ°„μ— μ—μ΄μ „νŠΈμ˜ μ—­λŸ‰(λΉ λ₯Έ 루프)κ³Ό 톡신 ν† ν΄λ‘œμ§€(느린 루프)λ₯Ό λ™μ‹œμ— μ μ‘μ‹œμΌœ μ‘°μ • μ•ˆμ •μ„±μ„ μœ μ§€ν•œλ‹€ [25]. - **μ‘μš© 도메인:** - **톡신(6G):** 자율 감지, μ˜μ‚¬κ²°μ •, ꡬ성을 톡해 λ„€νŠΈμ›Œν¬ μžμ›μ„ μ‹€μ‹œκ°„μœΌλ‘œ μ΅œμ ν™”ν•˜λŠ” Self-Evolving Network(SEN)λ₯Ό κ΅¬ν˜„ν•œλ‹€ [9, 26]. - **의료:** μ˜μ‚¬, ν™˜μž, κ°„ν˜Έμ‚¬ μ—μ΄μ „νŠΈκ°€ 가상 μΌ€μ΄μŠ€λ₯Ό μΉ˜λ£Œν•˜λ©° 진단 μ „λž΅μ„ 슀슀둜 μ •κ΅ν™”ν•œλ‹€ [27, 28]. - **λ³΄μ•ˆ:** 취약점 보호 μ—μ΄μ „νŠΈλ“€μ΄ CVE κ³΅κ°œλΆ€ν„° 보호 μ‹œκ·Έλ‹ˆμ²˜ μƒμ„±κΉŒμ§€μ˜ 과정을 μžλ™ν™”ν•˜λ©°, μƒν˜Έ 감사 루프λ₯Ό 톡해 μ•ˆμ „μ„±μ„ κ²€μ¦ν•œλ‹€ [29-31]. ## βš–οΈ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & updates) - **Self-Evolution Trilemma (λΆˆκ°€λŠ₯의 μ‚Όμœ„μΌμ²΄):** μ—μ΄μ „νŠΈ μ‚¬νšŒλŠ” '지속적인 자기 μ§„ν™”', 'μ™„μ „ν•œ 격리', 'μ•ˆμ „ λΆˆλ³€μ„±'을 λ™μ‹œμ— λ§Œμ‘±ν•  수 μ—†λ‹€ [32-34]. 격리된 μƒνƒœμ—μ„œ 자기 μ§„ν™” μ‹œ 톡계적 μ‚¬κ°μ§€λŒ€μ™€ μ•ˆμ „ μ œμ•½ 쑰건의 손싀이 λΆˆκ°€μ‹œμ μœΌλ‘œ λˆ„μ λœλ‹€ [35, 36]. - **집단 편ν–₯ vs κ°œλ³„ μΆ”λ‘ :** 집단 토둠은 진단 정확도λ₯Ό 높일 수 μžˆμœΌλ‚˜, μ—μ΄μ „νŠΈλ“€μ΄ 집단 ν•©μ˜μ— κ³Όλ„ν•˜κ²Œ μ˜μ‘΄ν•˜κ²Œ λ˜μ–΄ κ°œλ³„ μΆ”λ‘  λŠ₯λ ₯이 μ €ν•˜λ˜λŠ” μœ„ν—˜μ΄ μ‘΄μž¬ν•œλ‹€ [37]. - **쿼리 μˆ˜μ€€ vs μž‘μ—… μˆ˜μ€€ μ›Œν¬ν”Œλ‘œ:** λͺ¨λ“  쿼리에 λŒ€ν•΄ κ°œλ³„ μ›Œν¬ν”Œλ‘œλ₯Ό μƒμ„±ν•˜λŠ” 것보닀, μƒμœ„ K개의 졜적 μž‘μ—… μˆ˜μ€€ μ›Œν¬ν”Œλ‘œκ°€ 더 효율적이고 넓은 λ²”μœ„λ₯Ό 컀버할 수 μžˆλ‹€λŠ” μ£Όμž₯이 μ œκΈ°λ˜μ—ˆλ‹€ [38]. ## πŸ› οΈ 적용 사둀 (Applied in summary) - **Darwin GΓΆdel Machine (DGM):** μ½”λ”© μ—μ΄μ „νŠΈκ°€ μžμ‹ μ˜ μ½”λ“œ μ €μž₯μ†Œ, 도ꡬ, μ›Œν¬ν”Œλ‘œλ₯Ό 슀슀둜 μˆ˜μ •ν•˜μ—¬ SWE-bench Verified μ„±λŠ₯을 20%μ—μ„œ 50%둜 ν–₯μƒμ‹œν‚¨ μ‹€μ œ 사둀가 λ³΄κ³ λ˜μ—ˆλ‹€ [23, 39]. - **Cato Networks CVE Protection Agent:** 16λ‹¨κ³„μ˜ ν•˜μœ„ μ—μ΄μ „νŠΈ μ›Œν¬ν”Œλ‘œλ₯Ό 톡해 CVE 뢄석뢀터 κ²€μ¦κΉŒμ§€ μžλ™ν™”ν•˜λ©°, μ—°κ΅¬μ›μ˜ ν”Όλ“œλ°±μ„ 톡해 λ‘œμ§μ„ μ§€μ†μ μœΌλ‘œ μ—…λ°μ΄νŠΈν•œλ‹€ [29, 40, 41]. - **CosmoPhoeniX-Halley:** ν˜œμ„± 탐사λ₯Ό μœ„ν•΄ μ‹œκ°, κ³„νš, λͺ¨ν„° μ œμ–΄ 등을 λ‹΄λ‹Ήν•˜λŠ” λΆ„μ‚°λœ μ§€λŠ₯ λ‹¨μœ„(TxMUs)와 MSRP(Mutual Surgical Repair Protocols)λ₯Ό ν†΅ν•œ μ—μ΄μ „νŠΈ κ°„ 물리적 수리 ν”„λ‘œν† μ½œμ„ μ„€κ³„ν•˜μ˜€λ‹€ [42-44]. - **NVIDIA NemoClaw:** `policy.yaml` νŒŒμΌμ— λ„€νŠΈμ›Œν¬ μ ‘κ·Ό 정책을 μ½”λ“œν™”ν•˜μ—¬ μ—μ΄μ „νŠΈμ˜ 도ꡬ μ‚¬μš© κΆŒν•œμ„ μ œμ–΄ν•˜κ³ , ATIF(Agent Trajectory Format)λ₯Ό 톡해 μ˜μ‚¬κ²°μ • 과정을 μΆ”μ ν•œλ‹€ [45, 46]. ## βœ… 검증 μƒνƒœ 및 신뒰도 - **μƒνƒœ:** draft - **검증 단계:** conceptual (DGM, Cato Agent λ“± 일뢀 μ‹œμŠ€ν…œμ—μ„œ μ‹€μ œ 적용 및 μ„±λŠ₯ ν–₯상 검증됨) - **좜처 신뒰도:** B (ArXiv Survey, ICLR Workshop, NVIDIA/Microsoft/Sakana AI 기술 λ³΄κ³ μ„œ 기반) - **쀑볡 검사 κ²°κ³Ό:** μ‹ κ·œ 생성 (New discovery) ## πŸ“ λ³€κ²½ 이λ ₯ (Change history) - 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine. (P-Reinforce v3.0 μ€€μˆ˜)