0441f6e2a2
- Formalized automatic record migration protocol in System Manual. - Integrated high-density knowledge for RAG, AI, Business Strategy, and Leadership. - Enhanced graph connectivity across core strategic hubs. - Archived raw data and updated timeline records.
28 lines
3.2 KiB
Markdown
28 lines
3.2 KiB
Markdown
# [[Adaptive RAG]]
|
|
|
|
## 📌 Brief Summary
|
|
Adaptive RAG(적응형 RAG)는 사용자의 질의(Query) 복잡성에 따라 검색(Retrieval) 전략과 깊이를 동적으로 조절하는 발전된 형태의 검색 증강 생성 시스템입니다 [1, 2]. 단순한 질의에는 검색을 생략하거나 최소한의 단일 검색만을 수행하는 반면, 복잡한 질문에는 다단계 검색과 추론 체인을 가동합니다 [1, 2]. 이를 통해 불필요한 거대 언어 모델(LLM) 호출 및 연산 비용을 줄이는 동시에 답변의 완전성과 정확성을 높이는 것이 핵심 목적입니다 [3].
|
|
|
|
## 📖 Core Content
|
|
* **질의 복잡성에 따른 동적 검색 전략 (Dynamic Retrieval Strategy)**
|
|
Adaptive RAG는 고정된 숫자의 문서를 가져오는 기존의 '상위 K개(Top-K)' 검색 패러다임을 벗어나, 질의의 수준에 맞춰 검색 방식을 세분화하여 적용합니다 [3].
|
|
* **단순 질의 (Simple queries):** 단순한 사실 확인 질문의 경우, 외부 정보 검색 없이 LLM이 직접 응답을 생성하거나 1회의 벡터 검색(Single-hop retrieval)만을 수행하여 신속하게 처리합니다 [1-3].
|
|
* **중간 복잡성 질의 (Medium complexity):** 일반적인 정보 탐색이 필요한 경우, 표준적인 RAG 파이프라인을 거쳐 답변을 생성합니다 [1].
|
|
* **복잡한 질의 (Complex multi-hop):** 다각도의 분석이나 논리적 추론이 필요한 질의에는 다단계 검색(Multi-stage retrieval), 의미론적 재순위화(Semantic re-ranking), 개체 그래프 탐색(Entity-graph traversal), 시간적 필터링 등을 결합한 반복적 검색 및 추론 체인을 활용합니다 [1-3].
|
|
|
|
* **기계 학습을 통한 시스템 최적화**
|
|
이러한 적응형 시스템은 강화학습(Reinforcement learning) 등을 통해 질의 유형별로 최적의 검색 깊이를 스스로 학습할 수 있도록 설계됩니다 [3].
|
|
|
|
* **비용 및 성능의 효율화**
|
|
질의 복잡성에 맞춰 검색 전략을 유연하게 조정함으로써, 불필요한 LLM 호출을 줄여 기업의 운영 비용을 절감하면서도 사용자가 요구하는 수준의 완전한 답변을 제공할 수 있습니다 [3].
|
|
|
|
## ⚖️ Trade-offs & Caveats
|
|
* **부적절한 검색 깊이 판별 위험**
|
|
Adaptive RAG 모델이 질의의 복잡성을 잘못 판단할 경우, 복잡한 질의에 대해 너무 적은 수의 문서를 검색하여 정보가 누락되거나 단순한 질의에 과도하게 문서를 검색하여 리소스를 낭비하는 등의 오류(Failure mode)가 발생할 수 있습니다 [4].
|
|
* **품질 관리 및 추가 시스템 구축의 필요성**
|
|
이러한 한계를 극복하기 위해서는 답변의 완전성을 지속적으로 평가하고, 정보의 공백이 감지될 경우 추가적인 검색을 유도하는 '검색 품질 게이트(Retrieval quality gates)'를 도입해야 합니다 [4].
|
|
* **모델 유지보수 부담 증가**
|
|
오류를 최소화하기 위해 실제 프로덕션 트래픽 데이터를 바탕으로 훈련된 질의 복잡성 분류기(Query complexity classifiers)를 지속적으로 유지하고 관리해야 하는 기술적, 운영적 부담이 발생합니다 [4].
|
|
|
|
---
|
|
*Last updated: 2026-05-04* |