4.2 KiB
4.2 KiB
AI Reasoning & Retrieval Architectures (AI 추론 및 검색 아키텍처)
📌 Brief Summary
AI 추론 및 검색 아키텍처는 거대 언어 모델(LLM)의 단순한 텍스트 생성을 넘어, 논리적 추론 능력을 극대화하고 외부 지식을 실시간으로 결합하여 정확도를 높이는 일련의 프레임워크와 기법을 의미한다. **Chain-of-Thought (CoT)**를 통한 사고의 단계화, **RAG (Retrieval-Augmented Generation)**를 통한 지식 증강, 그리고 ReAct, Reflection, **Self-verification**으로 이어지는 자율적 실행 루프가 그 핵심이다.
📖 Core Content
1. 추론 증폭 기법 (Reasoning Amplification)
- Chain-of-Thought (CoT) (사고 사슬): 문제를 단계별로 풀어나가는 중간 추론 과정을 명시적으로 생성하게 하여 복잡한 논리 문제의 정답률을 높이는 기법. 최근에는 모델 내부에서 잠재적으로 수행되는 'Internal CoT'로 진화하고 있다.
- ReAct (Reasoning and Acting): 추론(Reasoning)과 행동(Acting)을 결합하여, 모델이 스스로 계획을 세우고 외부 도구를 호출하며 그 결과를 다시 추론에 반영하는 방식.
- Reflection (자기 성찰): 생성된 결과물을 모델이 다시 검토하여 오류를 찾아내고 수정하는 과정. "자신이 짠 코드가 원래 요청과 일치하는가?"를 묻는 비판적 사고를 강제한다.
2. 지식 증강 및 오케스트레이션 (Knowledge & Orchestration)
- RAG (Retrieval-Augmented Generation) (검색 증강 생성): 실시간으로 관련 문서를 검색하여 컨텍스트에 주입함으로써 할루시네이션을 방지하고 최신성을 확보하는 기술.
- LangGraph 및 그래프 기반 오케스트레이션: 에이전트의 행동을 노드(Node)와 에지(Edge)로 정의하고, 상태(State)와 조건부 라우팅을 명시적으로 제어하는 프레임워크. 장기 실행(Long-horizon) 작업과 복잡한 워크플로우 제어에 최적화되어 있다.
- Self-verification (자가 검증): 에이전트가 작업을 마친 후 테스트 스위트 실행이나 Puppeteer 기반의 브라우저 테스팅을 통해 결과의 논리적 무결성을 스스로 입증하는 과정.
3. 하네스 수준의 제어 메커니즘
- PIV 루프 (Plan-Implement-Validate): 에이전트 실행의 표준 파이프라인.
- 미들웨어 개입 (Hooks): 에이전트가 종료되기 전 이를 가로채어 검증 패스를 강제하거나(PreCompletionChecklistMiddleware), 무한 루프를 탐지하여 전략 수정을 유도하는 제어 계층.
⚖️ Trade-offs & Caveats
- 컴퓨팅 리소스와 성능의 균형: CoT나 Reflection 단계가 추가될수록 정답률은 높아지지만 토큰 소비량과 응답 지연 시간(Latency)이 급격히 증가한다.
- 파멸의 루프 (Doom Loops): 에이전트가 잘못된 계획에 집착하여 동일한 오류를 반복하는 현상. 이를 방지하기 위한 루프 감지 및 컨텍스트 재주입 로직이 필수적이다.
- 데이터 품질 종속성: 오케스트레이션이 완벽하더라도 주입되는 소스 데이터가 오염(Data Drift)되어 있으면 에이전트는 정교하게 틀린 답을 도출하게 된다.
🔗 Knowledge Connections
Related Concepts
- Agent Harness (에이전트 하네스): 이러한 추론 아키텍처가 실제로 구동되는 실행 런타임이자 거버넌스 계층.
- Context Engineering (컨텍스트 엔지니어링): 제한된 토큰 내에서 최적의 추론을 이끌어내기 위한 데이터 압축 및 주입 기술.
- Model Context Protocol (MCP): 에이전트가 외부 도구와 통신하기 위한 표준 인터페이스.
Deeper Research Questions
- 모델 내부에서만 수행되는 '잠재적 CoT'와 명시적인 '텍스트 기반 CoT' 중 어떤 것이 장기적인 정렬(Alignment)과 관측 가능성 면에서 유리한가?
- 무한 루프를 감지했을 때 모델의 추론 온도를 조절하거나 완전히 다른 경로로 라우팅하는 자율적 복구 메커니즘의 최적 설계는?
Last updated: 2026-05-05