# [[Agent Harness (에이전트 하네스)]] ## 📌 Brief Summary Agent Harness는 에이전트(LLM)가 독립적으로 동작하지 않고, 시스템 자원(파일, 네트워크, 도구)에 접근하고, 상태를 유지하며, 외부와 소통할 수 있도록 감싸는 **'실행 런타임이자 거버넌스 계층'**이다. 에이전트에게는 외부 세계와 소통하는 인터페이스를 제공하고, 시스템에게는 에이전트의 행동을 통제하고 관찰하는 보안 및 운영 경계를 제공한다. 최근에는 이를 **'Agent OS'**라고도 부른다. ## 📖 Core Content * **6대 구성 요소 (Standard Architecture)**: * **[[C-component (Context Manager)]]**: 컨텍스트 조립, 우선순위 할당 및 압축 관리. * **[[E-component (Execution Loop)]]**: 에이전트의 사고-행동-관찰(ReAct) 반복 루프 제어. * **[[L-component (Lifecycle Hooks)]]**: 이벤트 인터셉터, 정책 강제(Policy Enforcement) 및 권한 제어 계층. * **[[S-component (State Store)]]**: 단기/장기 메모리, 체크포인트 및 지식 지속성 관리. * **[[T-component (Tool Registry)]]**: 외부 도구 연결 표준화(MCP 등) 및 실행 보안 관리. * **[[V-component (Evaluation Interface)]]**: 결과의 논리적 무결성 검증 및 자가 수정 피드백 루프. * **시스템 자원 추상화 및 격리**: 에이전트가 호스트 OS API를 직접 호출하는 대신, 하네스가 제공하는 가상화된 파일 시스템과 [[Sandbox (샌드박스)]] 환경을 통해 안전하게 상호작용한다. * **관측 가능성 (Observability)**: 에이전트의 사고 과정(Thought), 도구 호출 로그, 데이터 흐름을 실시간으로 추적하여 디버깅 및 보안 감사를 수행한다. ## ⚖️ Trade-offs & Caveats * **추상화 오버헤드**: 하네스 계층(미들웨어, 샌드박스)이 복잡해질수록 에이전트의 반응 속도(Latency)가 저하될 수 있다. * **데이터 무결성 검증의 한계**: 대다수의 프레임워크는 실행 흐름은 통제하지만, 주입되는 소스 데이터의 무결성(Data Integrity)을 보장하지 못해 오답이 자신감 있게 도출될 위험이 있다. * **컨텍스트 부패 (Context Rot)**: 다단계 작업 시 정보 누적으로 인한 망각이 발생하며, 이를 막기 위한 요약(Compaction) 과정에서 맥락과 출처(Provenance)가 손실될 수 있다. * **하네스 오버피팅**: 특정 하네스 시스템의 도구 구조에 모델이 과도하게 적응하여 범용성이 저하되는 현상이 나타날 수 있다. ## 🔗 Knowledge Connections ### Related Concepts * [[Agent Loop (에이전트 루프)]] * 연결 이유: 하네스 내부에서 모델이 사고와 행동을 반복하게 만드는 핵심 실행 엔진 구조이다. * [[Context Engineering (컨텍스트 엔지니어링)]] * 연결 이유: 토큰 한계 극복을 위한 데이터 주입, 압축 및 프롬프트 캐싱 기술이 하네스의 성능을 결정한다. * [[Model Context Protocol (MCP)]] * 연결 이유: 하네스 내부 에이전트가 외부 도구 및 데이터 소스와 통신하기 위한 표준 프로토콜이다. * [[Human-in-the-Loop (HITL)]] * 연결 이유: 고위험 작업 전 인간의 승인을 강제하여 자율 시스템의 안전성을 담보하는 거버넌스 장치이다. ### Deeper Research Questions * 상태 비저장(Stateless) LLM이 장기 작업 중 직면하는 'AI 기억상실' 문제를 하네스의 메모리 시스템은 어떻게 구조적으로 극복하는가? * 오케스트레이션 프레임워크의 '실행 제어'와 데이터 솔루션의 '품질 거버넌스'를 단일 하네스 아키텍처 내에서 결합하는 방법은 무엇인가? * 무한 루프(Doom Loop)에 빠진 에이전트를 하네스가 감지하고 스스로 복구(Self-healing)하도록 유도하는 피드백 루프의 설계 원리는? ### Practical Application Contexts * **Implementation:** LangChain, CrewAI 등을 기반으로 MCP를 통해 사내 도구를 연동하고, Docker 기반의 샌드박스를 래핑하여 프로덕션 환경을 구축한다. * **Operation:** 하네스에 통합된 Observability 도구(AgentOps 등)를 통해 실행 트레이스를 모니터링하고, 반복되는 오류를 규칙 갱신을 통해 교정(Steering)한다. --- *Last updated: 2026-05-05*