Files
2nd/10_Wiki/Topics/AI_and_ML/Agentic RAG.md
T

2.8 KiB


id: P-Reinforce-AUTO-ARAG-001 category: Unified confidence_score: 1.00 tags: [auto-reinforced, agentic-rag, autonomous-agent, multi-step-retrieval, reasoning-loop] last_reinforced: 2026-05-04

Agentic RAG

📌 한 줄 통찰 (The Karpathy Summary)

"생각하는 검색: 단순히 질문에 답하는 것을 넘어, 에이전트가 스스로 쿼리를 분해하고, 검색 결과가 충분한지 판단하며, 필요하다면 다시 검색하거나 도구를 사용하는 자율적인 지식 탐구 루프."

📖 구조화된 지식 (Synthesized Content)

Agentic RAG는 전통적인 일회성 RAG 파이프라인에 에이전트의 추론(Reasoning) 능력을 결합한 고도화된 아키텍처입니다.

  1. 핵심 차이점:
    • Naive RAG: 질문 \rightarrow 검색 \rightarrow 답변 (선형적).
    • Agentic RAG: 질문 \rightarrow 전략 수립 \rightarrow 검색 \rightarrow 평가 \rightarrow (부족하면) 재전략/재검색 \rightarrow 최종 답변 (순환적).
  2. 주요 메커니즘:
    • Query Decomposition: 복잡한 질문을 여러 개의 하위 질문으로 나누어 각각 검색합니다.
    • Self-Correction: 검색된 결과가 질문과 관련이 없거나 상충될 경우, 에이전트가 이를 감지하고 검색어(Query)를 수정하여 다시 시도합니다.
    • Tool Use: 벡터 DB뿐만 아니라 웹 검색, SQL 실행, 계산기 등 다양한 도구를 상황에 맞게 선택하여 활용합니다.
  3. 해결하는 문제:
    • Lost in the middle: 방대한 컨텍스트를 한꺼번에 주입하는 대신, 가장 강력한 증거만 선별하여 전략적으로 배치함으로써 모델의 인지 부하를 줄입니다.
    • Loud Failure: 검색이 실패했을 때 모르는 것을 명확히 인지하고 사용자에게 다시 묻거나 대안을 제시할 수 있습니다.

⚖️ Trade-offs & Caveats

  • 높은 비용 및 지연: 여러 번의 LLM 호출과 반복적인 검색 루프를 거치므로 단발성 RAG보다 응답 속도가 느리고 비용이 많이 발생합니다.
  • 루프 탈출 문제: 에이전트가 답을 찾지 못하고 무한 루프에 빠지거나 엉뚱한 방향으로 파고들 위험이 있어, 명확한 종료 조건과 가드레일 설계가 필수적입니다.

🔗 지식 연결 (Graph)


Last updated: 2026-05-04