[G1-Sync] Manual knowledge update

2026-06-12 22:12:56 +09:00
parent 89fb05a28a
commit a4f58e0d9e
107 changed files with 7919 additions and 6 deletions
@@ -0,0 +1,65 @@
+---
+id: task-agent
+title: "Task Agent"
+category: "10_Wiki/Topics"
+status: "draft"
+verification_status: "conceptual"
+canonical_id: ""
+aliases: ["Operational Agent", "Domain Agent"]
+duplicate_of: ""
+source_trust_level: "B"
+confidence_score: 0.85
+created_at: 2026-06-12
+updated_at: 2026-06-12
+review_reason: ""
+merge_history: []
+tags: ["research", "self envolving"]
+raw_sources: ["NotebookLM Synthesis"]
+applied_in: ["Darwin Gödel Machine (DGM)", "Hyperagents (DGM-H)", "ASI-Evolve", "Cato Multi-Modal Vulnerability Protection Agent"]
+github_commit: ""
+---
+
+# [[Task Agent]]
+
+## 🎯 한 줄 통찰 (One-line insight)
+자기 진화 시스템(Self-evolving system)에서 **실제 도메인 업무를 수행하는 주체**이며, 시스템의 안정성과 안전을 위해 수정 제안 주체(Meta-Agent)로부터 **아키텍처적으로 분리된 실행 계층**이다 [1, 2].
+
+## 🧠 핵심 개념 (Core concepts)
+1. **도메인 특화 실행 (Domain-Specific Execution):** 코딩, 보상 설계, 논문 리뷰 등 실제 물리적/디지털 환경과 상호작용하며 특정 과업을 완료하는 역할을 담당한다 [2].
+2. **아키텍처적 디커플링 (Architectural Decoupling):** 시스템 수정을 제안하는 Meta-Agent와 실행을 담당하는 Task Agent를 엄격히 분리하여, 자기 수정 루프가 핵심 안전 제약 조건을 직접 덮어쓰는 것을 방지한다 [1].
+3. **경험 및 궤적 생성기 (Trajectory Generator):** 실행 로그, 컴파일러 에러, 환경 피드백 등의 데이터를 생성하여 분석 에이전트나 학습 루프에 제공하는 데이터 원천이 된다 [3, 4].
+4. **검증 대상 (Subject of Validation):** Meta-Agent에 의해 제안된 모든 수정 사항은 Task Agent에 통합되기 전 반드시 불변의 안전 기준에 따라 검토되어야 하는 '후보 상태'로 취급된다 [1].
+
+## 🧩 추출된 패턴 (Extracted patterns)
+*   **역할 분담 패턴 (Role Division):** 자기 진화형 MAS(Multi-Agent System)에서 수정(Meta), 실행(Task), 분석(Analyzer) 등의 역할을 분리하여 시스템 붕괴를 막는 구조적 안정성을 확보한다 [2, 5].
+*   **후보-검증-통합 사이클 (Candidate-Validation-Integration):** Task Agent의 코드나 프롬프트 정책을 직접 수정하는 대신, 가상 환경(Sandbox)에서 검증된 후에만 실제 운영 계층으로 승격시킨다 [6, 7].
+*   **운영 기질의 진화 (Evolution of Operational Substrate):** 단순 파라미터 튜닝이 아니라, Task Agent가 사용하는 도구(Tools), 재시도 로직(Retry Logic), 컨텍스트 관리 방식 등을 구조적으로 개선한다 [8].
+
+## 📖 세부 내용 (Details)
+*   **기능적 정의:** Task Agent는 자기 진화 아키텍처 내에서 **도메인 특정 과업을 수행하는 에이전트**로 정의된다 [1]. 예를 들어, Hyperagents(DGM-H) 프레임워크에서 Task Agent는 코딩이나 논문 검토와 같은 도메인 작업을 처리한다 [2].
+*   **안정성 보장:** Task Agent와 행동 수정을 제안하는 Meta-Agent를 분리하는 것은 자가 수정 루프가 시스템의 핵심 안전 제약 사항을 파괴하는 것을 막기 위한 필수적인 사이버네틱 보호 장치이다 [1].
+*   **상호작용 루프:** Task Agent는 환경으로부터의 피드백($R_t$)과 안전 제약($C_t$)을 포함하는 전이 연산자($\Psi$)를 통해 그 구조적 구성($S_t$, 프롬프트 정책, 워크플로, 도구 등)이 지속적으로 업데이트된다 [9].
+*   **실제 성능 향상:** Darwin Gödel Machine(DGM)의 실험 결과에 따르면, Task Agent의 **편집 도구, 컨텍스트 처리, 후보 순위 지정 워크플로**를 수정함으로써 SWE-bench 성능을 20%에서 50%까지 향상시킬 수 있음이 증명되었다 [8, 10].
+*   **도메인 적용:** 
+    *   **보안:** 취약점 분석 및 보호 시그니처 생성을 담당하는 특화된 하위 에이전트들로 구성될 수 있다 [11].
+    *   **의료:** 진단 전략을 다듬고 환자 상호작용 궤적을 기록하는 의사/도구 에이전트의 형태를 띤다 [12].
+    *   **소프트웨어 엔지니어링:** 코드 리포지토리를 직접 수정하고 테스트를 실행하는 에이전트로 구현된다 [13].
+
+## ⚖️ 모순 및 업데이트 (Contradictions & updates)
+*   **직접 수정 vs. 매개 수정:** 초기 RSI(Recursive Self-Improvement) 논의에서는 에이전트가 자신의 가중치를 직접 수정하는 것을 강조했으나, 최신 연구(DGM 등)는 가중치는 고정하고 **에이전트 스캐폴드(Scaffold), 도구, 워크플로**를 코드로 수정하는 방식이 더 실용적이고 효과적임을 시사한다 [14-16].
+*   **자율성-안전 트릴레마:** 완전한 자율적 자기 진화를 추구할 경우 '안전 불변성(Safety Invariance)'이 유지되기 어렵다는 이론적 한계가 지적되었으며, 이를 위해 외부 검증자나 인간의 개입이 필수적으로 요구된다 [17, 18].
+
+## 🛠️ 적용 사례 (Applied in summary)
+*   **Darwin Gödel Machine (DGM):** 코딩 에이전트(Task)가 자신의 리포지토리와 도구를 스스로 수정하며 진화하는 구조를 구현함 (Repo: `https://github.com/jennyzzt/dgm`) [13, 19].
+*   **Hyperagents (DGM-H):** Meta 계층에서 Task Agent의 행동과 자기 개선 절차를 동시에 수정하도록 설계됨 [2, 20].
+*   **ASI-Evolve:** '연구원(Researcher)'과 '엔지니어(Engineer)'라는 분리된 역할을 통해 연구 파이프라인(Task)을 자율적으로 수행하고 분석함 [5].
+*   **Cato Networks:** CVE 취약점 분석부터 보호 생성까지 5단계 워크플로를 수행하는 자가 진화형 보호 에이전트를 실제 운영에 적용함 [21, 22].
+
+## ✅ 검증 상태 및 신뢰도
+- **상태:** draft
+- **검증 단계:** conceptual (실제 적용 사례 다수 발견되어 applied/validated 계층에 근접함)
+- **출처 신뢰도:** B (ArXiv Survey, MDPI, NVIDIA/Microsoft Technical Blogs 등 주요 소스 기반)
+- **중복 검사 결과:** 신규 생성 (New discovery)
+
+## 📝 변경 이력 (Change history)
+- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine.