Files

T

Antigravity Agent d77ff5c625 wiki: Topic_Agent 신규 문서 일괄 추가 + ASTRA 성장 자산(인벤토리·reflections·장기기억) 동기화

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>

2026-06-12 23:51:14 +09:00

6.1 KiB

Raw Blame History

id, title, category, status, verification_status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, created_at, updated_at, review_reason, merge_history, tags, raw_sources, applied_in, github_commit

title

Task Agent

🎯 한 줄 통찰 (One-line insight)

자기 진화 시스템(Self-evolving system)에서 실제 도메인 업무를 수행하는 주체이며, 시스템의 안정성과 안전을 위해 수정 제안 주체(Meta-Agent)로부터 아키텍처적으로 분리된 실행 계층이다 [1, 2].

🧠 핵심 개념 (Core concepts)

도메인 특화 실행 (Domain-Specific Execution): 코딩, 보상 설계, 논문 리뷰 등 실제 물리적/디지털 환경과 상호작용하며 특정 과업을 완료하는 역할을 담당한다 [2].
아키텍처적 디커플링 (Architectural Decoupling): 시스템 수정을 제안하는 Meta-Agent와 실행을 담당하는 Task Agent를 엄격히 분리하여, 자기 수정 루프가 핵심 안전 제약 조건을 직접 덮어쓰는 것을 방지한다 [1].
경험 및 궤적 생성기 (Trajectory Generator): 실행 로그, 컴파일러 에러, 환경 피드백 등의 데이터를 생성하여 분석 에이전트나 학습 루프에 제공하는 데이터 원천이 된다 [3, 4].
검증 대상 (Subject of Validation): Meta-Agent에 의해 제안된 모든 수정 사항은 Task Agent에 통합되기 전 반드시 불변의 안전 기준에 따라 검토되어야 하는 '후보 상태'로 취급된다 [1].

🧩 추출된 패턴 (Extracted patterns)

역할 분담 패턴 (Role Division): 자기 진화형 MAS(Multi-Agent System)에서 수정(Meta), 실행(Task), 분석(Analyzer) 등의 역할을 분리하여 시스템 붕괴를 막는 구조적 안정성을 확보한다 [2, 5].
후보-검증-통합 사이클 (Candidate-Validation-Integration): Task Agent의 코드나 프롬프트 정책을 직접 수정하는 대신, 가상 환경(Sandbox)에서 검증된 후에만 실제 운영 계층으로 승격시킨다 [6, 7].
운영 기질의 진화 (Evolution of Operational Substrate): 단순 파라미터 튜닝이 아니라, Task Agent가 사용하는 도구(Tools), 재시도 로직(Retry Logic), 컨텍스트 관리 방식 등을 구조적으로 개선한다 [8].

📖 세부 내용 (Details)

기능적 정의: Task Agent는 자기 진화 아키텍처 내에서 도메인 특정 과업을 수행하는 에이전트로 정의된다 [1]. 예를 들어, Hyperagents(DGM-H) 프레임워크에서 Task Agent는 코딩이나 논문 검토와 같은 도메인 작업을 처리한다 [2].
안정성 보장: Task Agent와 행동 수정을 제안하는 Meta-Agent를 분리하는 것은 자가 수정 루프가 시스템의 핵심 안전 제약 사항을 파괴하는 것을 막기 위한 필수적인 사이버네틱 보호 장치이다 [1].
상호작용 루프: Task Agent는 환경으로부터의 피드백(R_t)과 안전 제약(C_t)을 포함하는 전이 연산자(\Psi)를 통해 그 구조적 구성(S_t, 프롬프트 정책, 워크플로, 도구 등)이 지속적으로 업데이트된다 [9].
실제 성능 향상: Darwin Gödel Machine(DGM)의 실험 결과에 따르면, Task Agent의 편집 도구, 컨텍스트 처리, 후보 순위 지정 워크플로를 수정함으로써 SWE-bench 성능을 20%에서 50%까지 향상시킬 수 있음이 증명되었다 [8, 10].
도메인 적용:
- 보안: 취약점 분석 및 보호 시그니처 생성을 담당하는 특화된 하위 에이전트들로 구성될 수 있다 [11].
- 의료: 진단 전략을 다듬고 환자 상호작용 궤적을 기록하는 의사/도구 에이전트의 형태를 띤다 [12].
- 소프트웨어 엔지니어링: 코드 리포지토리를 직접 수정하고 테스트를 실행하는 에이전트로 구현된다 [13].

⚖️ 모순 및 업데이트 (Contradictions & updates)

직접 수정 vs. 매개 수정: 초기 RSI(Recursive Self-Improvement) 논의에서는 에이전트가 자신의 가중치를 직접 수정하는 것을 강조했으나, 최신 연구(DGM 등)는 가중치는 고정하고 에이전트 스캐폴드(Scaffold), 도구, 워크플로를 코드로 수정하는 방식이 더 실용적이고 효과적임을 시사한다 [14-16].
자율성-안전 트릴레마: 완전한 자율적 자기 진화를 추구할 경우 '안전 불변성(Safety Invariance)'이 유지되기 어렵다는 이론적 한계가 지적되었으며, 이를 위해 외부 검증자나 인간의 개입이 필수적으로 요구된다 [17, 18].

🛠️ 적용 사례 (Applied in summary)

Darwin Gödel Machine (DGM): 코딩 에이전트(Task)가 자신의 리포지토리와 도구를 스스로 수정하며 진화하는 구조를 구현함 (Repo: https://github.com/jennyzzt/dgm) [13, 19].
Hyperagents (DGM-H): Meta 계층에서 Task Agent의 행동과 자기 개선 절차를 동시에 수정하도록 설계됨 [2, 20].
ASI-Evolve: '연구원(Researcher)'과 '엔지니어(Engineer)'라는 분리된 역할을 통해 연구 파이프라인(Task)을 자율적으로 수행하고 분석함 [5].
Cato Networks: CVE 취약점 분석부터 보호 생성까지 5단계 워크플로를 수행하는 자가 진화형 보호 에이전트를 실제 운영에 적용함 [21, 22].

✅ 검증 상태 및 신뢰도

상태: draft
검증 단계: conceptual (실제 적용 사례 다수 발견되어 applied/validated 계층에 근접함)
출처 신뢰도: B (ArXiv Survey, MDPI, NVIDIA/Microsoft Technical Blogs 등 주요 소스 기반)
중복 검사 결과: 신규 생성 (New discovery)

📝 변경 이력 (Change history)

2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine.

6.1 KiB Raw Blame History