Files
2nd/10_Wiki/Topics/AI_and_ML/Agentic RAG.md
T

39 lines
2.8 KiB
Markdown

---
id: [[P-Reinforce|P-Reinforce]]-AUTO-ARAG-001
category: Unified
confidence_score: 1.00
tags: [auto-reinforced, agentic-rag, autonomous-agent, multi-step-retrieval, reasoning-loop]
last_reinforced: 2026-05-04
---
# [[Agentic RAG|Agentic RAG]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "생각하는 검색: 단순히 질문에 답하는 것을 넘어, 에이전트가 스스로 쿼리를 분해하고, 검색 결과가 충분한지 판단하며, 필요하다면 다시 검색하거나 도구를 사용하는 자율적인 지식 탐구 루프."
## 📖 구조화된 지식 (Synthesized Content)
Agentic RAG는 전통적인 일회성 RAG 파이프라인에 에이전트의 추론(Reasoning) 능력을 결합한 고도화된 아키텍처입니다.
1. **핵심 차이점**:
* **Naive RAG**: 질문 $\rightarrow$ 검색 $\rightarrow$ 답변 (선형적).
* **Agentic RAG**: 질문 $\rightarrow$ 전략 수립 $\rightarrow$ 검색 $\rightarrow$ 평가 $\rightarrow$ (부족하면) 재전략/재검색 $\rightarrow$ 최종 답변 (순환적).
2. **주요 메커니즘**:
* **Query Decomposition**: 복잡한 질문을 여러 개의 하위 질문으로 나누어 각각 검색합니다.
* **Self-Correction**: 검색된 결과가 질문과 관련이 없거나 상충될 경우, 에이전트가 이를 감지하고 검색어(Query)를 수정하여 다시 시도합니다.
* **Tool Use**: 벡터 DB뿐만 아니라 웹 검색, SQL 실행, 계산기 등 다양한 도구를 상황에 맞게 선택하여 활용합니다.
3. **해결하는 문제**:
* **[[Lost in the middle|Lost in the middle]]**: 방대한 컨텍스트를 한꺼번에 주입하는 대신, 가장 강력한 증거만 선별하여 전략적으로 배치함으로써 모델의 인지 부하를 줄입니다.
* **Loud Failure**: 검색이 실패했을 때 모르는 것을 명확히 인지하고 사용자에게 다시 묻거나 대안을 제시할 수 있습니다.
## ⚖️ Trade-offs & Caveats
* **높은 비용 및 지연**: 여러 번의 LLM 호출과 반복적인 검색 루프를 거치므로 단발성 RAG보다 응답 속도가 느리고 비용이 많이 발생합니다.
* **루프 탈출 문제**: 에이전트가 답을 찾지 못하고 무한 루프에 빠지거나 엉뚱한 방향으로 파고들 위험이 있어, 명확한 종료 조건과 가드레일 설계가 필수적입니다.
## 🔗 지식 연결 (Graph)
* **기반 기술**: [[Retrieval-Augmented Generation (RAG)|Retrieval-Augmented Generation (RAG)]], [[Autonomous Agents|Autonomous Agents]]
* **연관 기술**: [[Re-ranking|Re-ranking]], [[Chain-of-Thought (CoT)|Chain-of-Thought (CoT)]], [[Model Context Protocol (MCP)|MCP]]
* **해결 현상**: [[Lost in the middle|Lost in the middle]]
---
*Last updated: 2026-05-04*