E-component (Execution Loop)

📌 Brief Summary

E-component(Execution Loop)는 에이전트 하네스의 '심장'에 해당하는 구성 요소로, 에이전트가 목표를 달성할 때까지 수행하는 관찰(Observe) - 사고(Think) - 행동(Act) 루프를 제어하고 관리한다. 에이전트의 생명 주기를 유지하며, 언제 모델을 호출하고 언제 도구를 실행할지, 그리고 작업이 완료되었는지를 판단하는 결정론적(Deterministic) 흐름 제어 계층이다.

📖 Core Content

루프 제어 전략:
- 고정 반복 (Fixed Iteration): 사전에 정의된 횟수만큼 루프를 실행.
- 조건 기반 종료 (Condition-based): 모델이 "완료" 신호를 보내거나, 특정 결과값에 도달했을 때 종료.
- 자기 반성 (Self-Correction): 루프 내부에서 이전 행동의 결과를 평가하고 다음 행동을 수정하는 단계(Reflexion)를 포함.
상태 전이 관리 (State Transition): 루프의 각 단계에서 에이전트의 내부 상태가 어떻게 변하는지 추적하며, 오류 발생 시 이전 상태로 복구(Rollback)하거나 재시도(Retry)하는 로직을 수행한다.
비동기 작업 관리: 장시간 실행되는 도구나 외부 API 호출 시 루프가 멈추지 않도록 비동기 스트리밍과 이벤트 대기 메커니즘을 관리한다.
휴먼-인-더-루프 (HITL) 개입: 루프의 특정 지점에서 인간의 승인을 기다리거나 피드백을 받아 작업 방향을 수정하는 중단점(Breakpoints)을 제어한다.
토큰 및 비용 가드레일: 무한 루프에 빠져 토큰을 과도하게 소모하는 것을 방지하기 위해 최대 실행 시간이나 비용 한도를 강제한다.

⚖️ Trade-offs & Caveats

루프 깊이와 정확도: 루프를 많이 돌수록 결과의 품질은 향상될 수 있으나(Test-time scaling), 지연 시간과 비용이 비례해서 증가한다.
무한 루프 리스크: 모델이 동일한 잘못된 행동을 반복하며 루프를 탈출하지 못하는 '논리적 데드락'에 빠질 수 있다.
상태 폭발: 루프가 길어질수록 컨텍스트에 쌓이는 데이터가 많아져 모델의 성능이 저하(Context Rot)될 수 있다.

🔗 Knowledge Connections

Agent Harness
- 연결 이유: E-component는 하네스의 실행 주체이다.
C-component (Context Manager)
- 연결 이유: 루프가 한 번 돌 때마다 C-component가 갱신된 컨텍스트를 공급해야 한다.
Self-verification
- 연결 이유: E-component 내에서 결과의 신뢰성을 검증하는 핵심 기법이다.

Deeper Research Questions

에이전트가 작업의 '난이도'를 스스로 평가하여 루프의 복잡도를 동적으로 조절하는 스케줄링 알고리즘은 무엇인가?
다중 에이전트 협업 시, 여러 에이전트의 개별 실행 루프를 하나의 상위 루프(Orchestration Loop)로 통합하는 효율적인 방법은 무엇인가?
루프 실행 중 발생하는 중간 산출물(Intermediate thoughts) 중 어떤 정보가 최종 결과 도달에 결정적이었는지를 분석하여 향후 루프를 최적화하는 기법은 무엇인가?

Practical Application Contexts

Implementation: while 루프 내에서 agent.think()와 agent.act()를 호출하고, 각 단계의 결과를 AgentHistory에 기록하는 구조로 구현한다.
System Design: 웹 서비스 환경에서 에이전트 실행 루프를 백그라운드 작업(Celery, Redis 등)으로 처리하여 사용자의 연결이 끊겨도 작업이 완료되도록 설계한다.

Last updated: 2026-05-01

3.8 KiB Raw Blame History