Adaptive Context Compaction (적응형 컨텍스트 압축)

📌 Brief Summary

Adaptive Context Compaction은 에이전트의 현재 작업 상태, 토큰 소모량, 그리고 모델의 성능 유지 능력을 실시간으로 평가하여, 컨텍스트 윈도우 내의 정보를 동적으로 압축하거나 제거하는 최적화 기술이다. 모든 정보를 동일하게 요약하는 대신, 작업에 결정적인 정보는 원본을 유지하고 부수적인 정보는 고도로 압축하는 '가변적 압축률'을 적용하는 것이 핵심이다.

📖 Core Content

가변적 요약 (Variable-rate Summarization): 현재 진행 중인 작업(WTM)과 관련된 대화는 상세히 유지하고, 이미 완료된 단계나 단순 정보 탐색 로그는 한 문장으로 압축한다.
증거 보존 정책 (Evidence Retention): 실제 읽은 파일 내용이나 실행 결과(Evidence Memory) 중 핵심 수치나 코드는 압축 대상에서 제외하여 정보의 구체성(Concreteness)을 유지한다.
동적 슬라이딩 윈도우: 단순히 오래된 순으로 삭제하는 것이 아니라, 작업의 인과 관계(Causal Chain)를 분석하여 중요도가 낮은 과거 블록을 선택적으로 폐기한다.
의도 추출 (Intent Extraction): 대화 이력을 그대로 요약하기보다 "사용자가 A를 요청했고 에이전트가 B를 제안하여 최종적으로 C로 결정함"과 같이 의도와 결정 사항 중심으로 지식을 추출한다.

⚖️ Trade-offs & Caveats

추론 부하: 압축 결정을 내리고 실제 압축을 수행하는 과정에서 모델의 지능을 사용하므로, 잦은 압축은 시스템 반응 속도를 늦출 수 있다.
복구 불가능성: 압축 과정에서 버려진 세부 정보가 나중에 필요해질 경우, 다시 원본을 조회하거나 재작성해야 하는 비용이 발생한다.

🔗 Knowledge Connections

Context Engineering
- 연결 이유: 압축 기술은 컨텍스트 엔지니어링을 구현하는 핵심 수단이다.
Summary Drift
- 연결 이유: 과도하거나 반복적인 압축은 정보의 왜곡을 초래할 수 있다.
Inference-Coupled Persistence
- 연결 이유: 압축된 정보를 영구 저장소에 저장하여 향후 세션에서 재활용한다.

Deeper Research Questions

작업의 '중요도'를 모델이 판단하게 할 때, 편향이나 누락 없이 평가하게 만드는 가이드라인(Persona)은 무엇인가?
압축 전후의 작업 성공률을 비교하여 최적의 압축 시점(Compression Trigger)을 결정하는 강화 학습 모델을 설계할 수 있는가?
압축된 지식과 원본 지식 간의 계층적 구조를 만들어, 필요할 때만 원본을 불러오는 '페이징(Paging)' 시스템은 어떻게 구현하는가?

Practical Application Contexts

Implementation: 하네스의 C-component에서 토큰 사용량이 70%를 넘을 때 자동으로 '압축 에이전트'를 호출하여 이력을 정제한다.
System Design: 에이전트가 "이 부분은 나중에 다시 필요할 것 같아"라고 표시(Marking)한 컨텍스트 블록은 압축 우선순위에서 제외하는 태그 시스템을 구축한다.

Last updated: 2026-05-01

3.3 KiB Raw Blame History