Files
2nd/01_Archive/2026-05-04/검색 증강 생성 (Advanced RAG).md
Antigravity Agent 0441f6e2a2 feat(wiki): implement P-Reinforce v3.0 standard & integrate 26+ new knowledge artifacts
- Formalized automatic record migration protocol in System Manual.
- Integrated high-density knowledge for RAG, AI, Business Strategy, and Leadership.
- Enhanced graph connectivity across core strategic hubs.
- Archived raw data and updated timeline records.
2026-05-04 22:40:32 +09:00

4.6 KiB

검색 증강 생성 (Advanced RAG)

📌 Brief Summary

검색 증강 생성(Advanced RAG)은 대규모 언어 모델(LLM)의 환각 현상을 줄이고 정보의 최신성 및 정확성을 높이기 위해 외부 지식 베이스를 실시간으로 검색 및 결합하는 기술이다 [1-3]. 단순한 선형 구조의 초창기 RAG(Naive RAG)가 가진 낮은 정밀도와 재현율의 한계를 극복하기 위해, 하이브리드 검색, 재순위화(Reranking), 쿼리 확장 등의 고도화된 기법이 도입되었다 [4-6]. 최근에는 고정된 파이프라인을 넘어 시스템 스스로 검색 전략을 계획하고 평가하며 다단계 추론을 수행하는 '에이전틱 RAG(Agentic RAG)' 체계로 진화하고 있다 [5, 6].

📖 Core Content

  • 초기 RAG의 한계와 고도화(Advanced RAG)의 필요성: 기본적인 Naive RAG는 잘못 정렬된 청크로 인한 낮은 정밀도, 관련 청크를 찾지 못하는 낮은 재현율, 정보의 중복 및 반복과 같은 한계를 지닌다 [4]. 이를 해결하기 위해 Advanced RAG는 지능적 청킹(Intelligent Chunking), 재순위화(Reranking), 쿼리 확장, 하이브리드 검색(의미론적 벡터 검색과 키워드 검색의 결합) 등을 도입하여 검색의 정확도를 향상시킨다 [5, 6].
  • 주요 Advanced RAG 기법:
    • Self-Reflective RAG (Self-RAG): 시스템이 자체적으로 검색 및 생성 품질을 평가한다. 외부 정보 검색이 필요한지 판단하고, 검색된 문서의 관련성을 평가하며, 생성된 답변을 자가 비판하여 신뢰성이 낮을 경우 반복적으로 개선한다 [6, 7].
    • Corrective RAG (CRAG): 검색 오류를 적극적으로 수정한다. 문서의 품질을 평가하고 내부 지식이 부족할 경우 웹 검색으로 대체(Fallback)하며, 정확성을 기반으로 지식을 필터링한다 [7].
    • Adaptive RAG: 사용자의 쿼리 복잡도에 따라 검색 전략을 동적으로 조정한다 [8]. 단순한 쿼리는 검색 없이 LLM이 직접 답변하고, 중간 복잡도는 표준 RAG를 사용하며, 복잡한 다중 홉(Multi-hop) 쿼리는 반복적인 검색과 추론을 수행한다 [8].
    • Graph RAG: 문서들을 평면적인 텍스트가 아닌 개체-관계(Entity-relationship) 그래프로 구성하여 문서 간의 관계를 파악하고, 주제 수준의 다중 홉 질의를 처리할 수 있게 한다 [5, 9].
    • 에이전틱 RAG (Agentic RAG): 검색 도구를 자율적으로 활용하는 다단계 추론 시스템이다. 언제 정보를 검색해야 할지 결정하고, 결과를 관찰한 후 추가 검색을 수행하는 등 복잡한 문제를 해결하기 위한 자율적 정보 수집 전략을 구사한다 [5, 6, 10].

⚖️ Trade-offs & Caveats

  • 컴퓨팅 비용 및 지연 시간 증가: RAG 시스템은 데이터 검색과 텍스트 생성을 동시에 수행하므로 단독 LLM을 사용할 때보다 계산 리소스가 더 많이 소요되며, 실시간 데이터베이스 쿼리로 인해 대기 시간이 발생할 수 있다 [11]. 특히 지식 그래프(Knowledge Graph) 추출을 활용하는 Graph RAG는 기존 RAG 시스템에 비해 LLM 호출 비용이 3~5배 더 소요되며, 도메인에 따라 개체 인식 시 노이즈가 발생하거나 잘못된 관계가 도출될 수 있다 [9, 12].
  • 에이전트 검색의 무한 루프 및 불투명성: 자율적으로 검색을 수행하는 Agentic RAG는 답변에 수렴하지 못하고 유사한 정보를 반복적으로 가져오는 무한 검색 루프에 빠질 위험이 있다 [13]. 또한, 에이전트의 추론 과정이 불투명해져 시스템이 특정 검색 결정을 내린 이유를 감사(Audit)하기 어려워지는 문제가 발생할 수 있다 [13].
  • 적응형 검색의 판단 오류: Adaptive RAG 시스템이 검색 깊이를 잘못 결정할 경우, 복잡한 쿼리에 대해 너무 적은 문서를 검색하거나 반대로 단순한 쿼리에 너무 많은 문서를 검색(Over-retrieval)하는 오류가 발생할 수 있다 [14, 15].
  • 시스템 모니터링(Observability) 및 보안 적용에 따른 오버헤드: 시스템의 모든 검색 과정을 모니터링하고 추적하기 위한 가시성 인프라는 전체 응답 대기 시간에 20~30%의 오버헤드를 발생시킬 수 있다 [16]. 또한, 보안 및 권한 관리를 검색 계층에 직접 내장할 경우 검색 속도 저하를 유발하거나 사용자에게 접근 불가능한 문서의 존재가 노출되는 사각지대가 형성될 수 있다 [17, 18].

Last updated: 2026-05-04