2.8 KiB
2.8 KiB
id: P-Reinforce-AUTO-AMMS-001 category: Unified confidence_score: 1.00 tags: [auto-reinforced, agent-memory, long-term-memory, short-term-memory, episodic-memory, vector-db] last_reinforced: 2026-05-04
Agent Memory Systems
📌 한 줄 통찰 (The Karpathy Summary)
"시간을 넘는 지능의 연속성: 단기적인 대화 맥락(Short-term)을 넘어, 과거의 모든 경험과 지식을 저장하고 필요할 때 의미적으로 회상(Long-term)함으로써 시간이 흐를수록 더 똑똑해지는 에이전트의 제2의 뇌."
📖 구조화된 지식 (Synthesized Content)
에이전트 메모리 시스템은 모델의 제한된 컨텍스트 윈도우를 넘어 정보를 영구적으로 유지하고 관리하는 체계입니다.
- 메모리 계층 구조:
- Short-term Memory (단기 메모리): 현재 대화 세션의 기록. 컨텍스트 윈도우 내에 존재하며 가장 빠르고 정확하게 참조됩니다.
- Long-term Memory (장기 메모리): 과거 세션의 기록이나 외부 지식. Vector Database에 저장되며 검색(Retrieval)을 통해 필요한 부분만 불러옵니다.
- Episodic Memory (일화 메모리): 에이전트가 수행했던 특정 작업의 과정과 결과(성공/실패)를 기록하여 미래의 유사한 작업에 참고합니다.
- Procedural Memory (절차 메모리): 에이전트가 도구를 사용하거나 특정 워크플로우를 수행하는 방법(노하우)을 저장합니다.
- 메모리 관리 전략:
- Eviction (제거): 중요도가 낮거나 오래된 정보를 삭제하여 제한된 자원을 관리합니다.
- Summarization (요약): 긴 대화 기록을 핵심 위주로 요약하여 토큰 사용량을 최적화합니다.
- Semantic Search: 키워드가 아닌 '의미'를 기준으로 관련 기억을 찾아냅니다.
⚖️ Trade-offs & Caveats
- Context Rot (컨텍스트 부패): 너무 많은 기억을 불러오면 모델이 현재 작업에 집중하지 못하거나 혼란을 겪는 현상이 발생합니다.
- 인프라 복잡성: 벡터 DB, 시맨틱 검색 서버, 캐싱 시스템 등 추가적인 인프라 구축과 유지보수 비용이 발생합니다.
- 프라이버시: 사용자의 개인적인 대화나 민감 정보가 장기 메모리에 저장될 경우 보안 및 개인정보 보호 문제가 중요해집니다.
🔗 지식 연결 (Graph)
- 상위 개념: Autonomous Agents & Workflows
- 기반 기술: Vector Database, Retrieval-Augmented Generation (RAG)
- 연관 기술: KV Cache Management, Context Window Management
Last updated: 2026-05-04