docs: integrate 72 technical fragments into 5 high-density clusters and archive originals

This commit is contained in:
Antigravity Agent
2026-05-05 23:02:17 +09:00
parent 078ec107f6
commit c28d2983a8
124 changed files with 12970 additions and 1523 deletions
+27 -29
View File
@@ -1,45 +1,43 @@
# [[Agent Harness (에이전트 하네스)]]
## 📌 Brief Summary
Agent Harness는 에이전트(LLM)가 독립적으로 동작하지 않고, 시스템 자원(파일, 네트워크, 도구)에 접근하고, 상태를 유지하며, 외부와 소통할 수 있도록 감싸는 **'실행 런타임이자 거버넌스 계층'**이다. 에이전트에게는 외부 세계와 소통하는 인터페이스를 제공하고, 시스템에게는 에이전트의 행동을 통제하고 관찰하는 보안 및 운영 경계를 제공한다. 최근에는 이를 **'Agent OS'**라고도 부른다.
Agent Harness는 에이전트(LLM)가 독립적으로 동작하지 않고, 시스템 자원(파일, 네트워크, 도구)에 접근하고, 상태를 유지하며, 외부와 소통할 수 있도록 감싸는 **'실행 런타임이자 거버넌스 계층'**이다 [1-3]. 에이전트에게는 외부 세계와 소통하는 인터페이스를 제공하고, 시스템에게는 에이전트의 행동을 통제하고 관찰하는 보안 및 운영 경계를 제공한다 [4, 5]. 최근에는 이를 **'Agent OS'** 또는 하네스가 에이전트의 역량을 증폭시킨다는 의미에서 **'Harness Multiplier'**라고도 부른다 [1, 6].
## 📖 Core Content
* **6대 구성 요소 (Standard Architecture)**:
* **[[C-component (Context Manager)]]**: 컨텍스트 조립, 우선순위 할당 및 압축 관리.
* **[[E-component (Execution Loop)]]**: 에이전트의 사고-행동-관찰(ReAct) 반복 루프 제어.
* **[[L-component (Lifecycle Hooks)]]**: 이벤트 인터셉터, 정책 강제(Policy Enforcement) 및 권한 제어 계층.
* **[[S-component (State Store)]]**: 단기/장기 메모리, 체크포인트 및 지식 지속성 관리.
* **[[T-component (Tool Registry)]]**: 외부 도구 연결 표준화(MCP 등) 및 실행 보안 관리.
* **[[V-component (Evaluation Interface)]]**: 결과의 논리적 무결성 검증 및 자가 수정 피드백 루프.
* **시스템 자원 추상화 및 격리**: 에이전트가 호스트 OS API를 직접 호출하는 대신, 하네스가 제공하는 가상화된 파일 시스템과 [[Sandbox (샌드박스)]] 환경을 통해 안전하게 상호작용한다.
* **관측 가능성 (Observability)**: 에이전트의 사고 과정(Thought), 도구 호출 로그, 데이터 흐름을 실시간으로 추적하여 디버깅 및 보안 감사를 수행한다.
* **하네스 아키텍처 (Standard Substrate)**:
* **[[C-component (Context Manager)]]**: 액티브 메타데이터를 기반으로 컨텍스트 조립하고, 토큰 제약을 극복하기 위한 압축 및 우선순위 관리 수행 [3, 8].
* **[[E-component (Execution Loop)]]**: **[[Ralph Loop]]**(사고-행동-관찰-평가) 또는 **[[Reasoning Loop]]**를 통해 에이전트의 추론 단계를 세밀하게 제어 [9, 10].
* **[[L-component (Lifecycle Hooks)]]**: 사전 작업 권한 승인(Pre-Action Authorization), 이벤트 인터셉터 및 정책 강제 계층 [1, 11].
* **[[S-component (State Store)]]**: 체크포인팅(Checkpointing)을 통한 상태 보존 및 장기 메모리의 지속성 관리 [11, 12].
* **[[T-component (Tool Registry)]]**: [[MCP (Model Context Protocol)]] 표준을 통한 도구 연결 및 보안 격리된 실행 환경 제공 [12, 13].
* **[[V-component (Evaluation Interface)]]**: LLM-as-judge를 활용한 논리적 무결성 검증 및 자가 수정 피드백 [13, 14].
* **추론 예산 (Reasoning Budget)**: 무한 루프를 방지하고 비용 효율성을 위해 토큰 및 시간 단위의 추론 예산을 설정하고 관리 (예: Token Savior) [11, 12].
* **L3 Meta-Factory**: 에이전트의 워크플로우와 추론 단계를 동적으로 생성하고 최적화하는 상위 메타 계층 [6, 15].
* **둠 루프 (Doom Loop) 감지**: 에이전트가 작동하지 않는 접근 방식을 끝없이 반복할 때, 하네스 계층의 **LoopDetectionMiddleware**가 이를 감지하고 계획을 재고(Reconsidering)하도록 강제 지침을 주입한다 [1, 5].
* **하네스 서비스화 (HaaS, Harness-as-a-Service)**: 에이전트 실행 환경을 클라우드 기반의 표준화된 서비스로 제공하여 인프라 구축 부담을 최소화하는 방식 [6, 16].
* **데이터 거버넌스 기판**: 대부분의 프레임워크가 놓치는 '데이터 품질'을 관리하기 위해, 입력 데이터의 리니지(Lineage)를 추적하고 인증 상태를 검증하는 계층 [1, 7].
* **공진화 (Co-evolution)**: 모델의 훈련 과정과 하네스 설계가 상호작용하며 발전하는 현상. 최신 모델은 하네스를 루프에 포함하여 사후 훈련(post-trained)을 진행하며, 이는 인간과 에이전트가 상호 학습하며 개선되는 팀워크 플랫폼의 기반이 된다 [1, 2].
## ⚖️ Trade-offs & Caveats
* **추상화 오버헤드**: 하네스 계층(미들웨어, 샌드박스)이 복잡해질수록 에이전트의 반응 속도(Latency)가 저하될 수 있다.
* **데이터 무결성 검증의 한계**: 대다수의 프레임워크는 실행 흐름은 통제하지만, 주입되는 소스 데이터의 무결성(Data Integrity)을 보장하지 못해 오답이 자신감 있게 도출될 위험이 있다.
* **컨텍스트 부패 (Context Rot)**: 다단계 작업 시 정보 누적으로 인한 망각이 발생하며, 이를 막기 위한 요약(Compaction) 과정에서 맥락과 출처(Provenance)가 손실될 수 있다.
* **하네스 오버피팅**: 특정 하네스 시스템의 도구 구조에 모델이 과도하게 적응하여 범용성이 저하되는 현상이 나타날 수 있다.
* **공진화의 경고 (Co-evolution Warning)**: 특정 하네스 환경에 모델이 과적합(Overfitting)되어, 도구의 로직이 조금만 바뀌어도 성능이 급격히 저하되는 일반화 능력 결여 문제를 초래할 수 있다 [1, 3, 5].
* **운영 부담 (Operational Burden)**: 하네스 인프라(샌드박스, 관측 도구 등)를 자체 호스팅(Self-hosting)할 경우, 소규모 팀에게는 막대한 시스템 유지 관리 비용이 발생한다 [10, 17].
* **연쇄적 실패 (Cascading Failures)**: 하네스 계층에서 데이터 무결성 검증이 부재할 경우, 잘못된 소스 데이터가 에이전트의 사고 과정을 오염시켜 전체 미션의 실패로 이어진다 [1, 18].
* **컨텍스트 부패 (Context Rot)**: 다단계 추론 과정에서 정보가 압축될 때 핵심 맥락과 출처(Provenance)가 손실되어, 에이전트가 '자신감 있는 오답'을 도출할 위험이 있다 [20, 21].
* **성능 오버헤드**: 보안 격리 및 관측성 도구 통합 시 시스템 실행 속도가 약 12~15% 저하될 수 있다 [14, 22].
## 🔗 Knowledge Connections
### Related Concepts
* [[Agent Loop (에이전트 루프)]]
* 연결 이유: 하네스 내부에서 모델이 사고와 행동을 반복하게 만드는 핵심 실행 엔진 구조이다.
* [[Context Engineering (컨텍스트 엔지니어링)]]
* 연결 이유: 토큰 한계 극복을 위한 데이터 주입, 압축 및 프롬프트 캐싱 기술이 하네스의 성능을 결정한다.
* [[Model Context Protocol (MCP)]]
* 연결 이유: 하네스 내부 에이전트가 외부 도구 및 데이터 소스와 통신하기 위한 표준 프로토콜이다.
* [[Human-in-the-Loop (HITL)]]
* 연결 이유: 고위험 작업 전 인간의 승인을 강제하여 자율 시스템의 안전성을 담보하는 거버넌스 장치이다.
### Deeper Research Questions
* 상태 비저장(Stateless) LLM이 장기 작업 중 직면하는 'AI 기억상실' 문제를 하네스의 메모리 시스템은 어떻게 구조적으로 극복하는가?
* 오케스트레이션 프레임워크의 '실행 제어'와 데이터 솔루션의 '품질 거버넌스'를 단일 하네스 아키텍처 내에서 결합하는 방법은 무엇인가?
* 무한 루프(Doom Loop)에 빠진 에이전트를 하네스가 감지하고 스스로 복구(Self-healing)하도록 유도하는 피드백 루프의 설계 원리는?
* [[Agentic Infrastructure & Observability (에이전틱 인프라 및 관측 가능성)]]
* 연결 이유: 하네스 내부에서 발생하는 에이전트의 사고와 행동을 트레이싱하고 디버깅하기 위한 필수 기반 시설이다.
* [[Agent Context & Memory Management (에이전트 컨텍스트 및 메모리 관리)]]
* 연결 이유: 하네스의 S-component가 상태를 유지하고 C-component가 데이터를 조립하는 핵심 메커니즘을 다룬다.
* [[Governance, Safety & Reliability (거버넌스, 안전 및 신뢰성)]]
* 연결 이유: 에이전트의 자율적 행동이 조직의 정책을 벗어나지 않도록 통제하는 하네스의 핵심 제어 원칙이다.
### Practical Application Contexts
* **Implementation:** LangChain, CrewAI 등을 기반으로 MCP를 통해 사내 도구를 연동하고, Docker 기반의 샌드박스를 래핑하여 프로덕션 환경을 구축한다.
* **Operation:** 하네스에 통합된 Observability 도구(AgentOps 등)를 통해 실행 트레이스를 모니터링하고, 반복되는 오류를 규칙 갱신을 통해 교정(Steering)한다.
* **Implementation:** Docker/Firecracker microVM 기반의 [[Sandbox (샌드박스)]]를 하네스에 래핑하여 에이전트의 코드 실행 환경을 물리적으로 격리한다.
* **Operation:** AgentOps 또는 Langfuse를 연동하여 실시간 트레이스를 분석하고, 실패 지점의 데이터를 역추적하여 프롬프트나 데이터 소스를 교정한다.
---
*Last updated: 2026-05-05*