Files
Antigravity Agent 0441f6e2a2 feat(wiki): implement P-Reinforce v3.0 standard & integrate 26+ new knowledge artifacts
- Formalized automatic record migration protocol in System Manual.
- Integrated high-density knowledge for RAG, AI, Business Strategy, and Leadership.
- Enhanced graph connectivity across core strategic hubs.
- Archived raw data and updated timeline records.
2026-05-04 22:40:32 +09:00

3.2 KiB

Adaptive RAG

📌 Brief Summary

Adaptive RAG(적응형 RAG)는 사용자의 질의(Query) 복잡성에 따라 검색(Retrieval) 전략과 깊이를 동적으로 조절하는 발전된 형태의 검색 증강 생성 시스템입니다 [1, 2]. 단순한 질의에는 검색을 생략하거나 최소한의 단일 검색만을 수행하는 반면, 복잡한 질문에는 다단계 검색과 추론 체인을 가동합니다 [1, 2]. 이를 통해 불필요한 거대 언어 모델(LLM) 호출 및 연산 비용을 줄이는 동시에 답변의 완전성과 정확성을 높이는 것이 핵심 목적입니다 [3].

📖 Core Content

  • 질의 복잡성에 따른 동적 검색 전략 (Dynamic Retrieval Strategy) Adaptive RAG는 고정된 숫자의 문서를 가져오는 기존의 '상위 K개(Top-K)' 검색 패러다임을 벗어나, 질의의 수준에 맞춰 검색 방식을 세분화하여 적용합니다 [3].

    • 단순 질의 (Simple queries): 단순한 사실 확인 질문의 경우, 외부 정보 검색 없이 LLM이 직접 응답을 생성하거나 1회의 벡터 검색(Single-hop retrieval)만을 수행하여 신속하게 처리합니다 [1-3].
    • 중간 복잡성 질의 (Medium complexity): 일반적인 정보 탐색이 필요한 경우, 표준적인 RAG 파이프라인을 거쳐 답변을 생성합니다 [1].
    • 복잡한 질의 (Complex multi-hop): 다각도의 분석이나 논리적 추론이 필요한 질의에는 다단계 검색(Multi-stage retrieval), 의미론적 재순위화(Semantic re-ranking), 개체 그래프 탐색(Entity-graph traversal), 시간적 필터링 등을 결합한 반복적 검색 및 추론 체인을 활용합니다 [1-3].
  • 기계 학습을 통한 시스템 최적화 이러한 적응형 시스템은 강화학습(Reinforcement learning) 등을 통해 질의 유형별로 최적의 검색 깊이를 스스로 학습할 수 있도록 설계됩니다 [3].

  • 비용 및 성능의 효율화 질의 복잡성에 맞춰 검색 전략을 유연하게 조정함으로써, 불필요한 LLM 호출을 줄여 기업의 운영 비용을 절감하면서도 사용자가 요구하는 수준의 완전한 답변을 제공할 수 있습니다 [3].

⚖️ Trade-offs & Caveats

  • 부적절한 검색 깊이 판별 위험 Adaptive RAG 모델이 질의의 복잡성을 잘못 판단할 경우, 복잡한 질의에 대해 너무 적은 수의 문서를 검색하여 정보가 누락되거나 단순한 질의에 과도하게 문서를 검색하여 리소스를 낭비하는 등의 오류(Failure mode)가 발생할 수 있습니다 [4].
  • 품질 관리 및 추가 시스템 구축의 필요성 이러한 한계를 극복하기 위해서는 답변의 완전성을 지속적으로 평가하고, 정보의 공백이 감지될 경우 추가적인 검색을 유도하는 '검색 품질 게이트(Retrieval quality gates)'를 도입해야 합니다 [4].
  • 모델 유지보수 부담 증가 오류를 최소화하기 위해 실제 프로덕션 트래픽 데이터를 바탕으로 훈련된 질의 복잡성 분류기(Query complexity classifiers)를 지속적으로 유지하고 관리해야 하는 기술적, 운영적 부담이 발생합니다 [4].

Last updated: 2026-05-04