# [[RAG (검색 증강 생성)]] ## 📌 Brief Summary RAG(검색 증강 생성, Retrieval-Augmented Generation)는 대형 언어 모델(LLM)의 생성 능력에 정보 검색 시스템을 결합하여 응답의 정확성과 관련성을 높이는 AI 아키텍처 패턴이다 [1, 2]. 이 기술은 모델을 재학습시키지 않고도 외부 지식 베이스나 기업 내부 데이터에서 실시간으로 관련 정보를 검색하여 답변의 맥락으로 활용한다 [1, 3, 4]. 이를 통해 기존 LLM이 가진 지식의 한계(Knowledge Cutoff), 환각(Hallucination) 현상을 극복하고 출처의 투명성을 보장할 수 있다 [5-7]. ## 📖 Core 파악 **작동 원리 및 주요 구성 요소** * **다단계 파이프라인**: RAG 시스템은 문서 수집 및 전처리(Document Ingestion), 텍스트를 벡터로 변환하는 임베딩 생성(Embedding Generation), 벡터 데이터베이스(Vector Database), 검색 메커니즘(Retrieval Mechanism), 그리고 프롬프트 엔지니어링 및 응답 생성(Generation)의 과정으로 구성된다 [8-11]. * **검색 및 증강 과정**: 사용자의 질의가 입력되면 검색 컴포넌트가 지식 베이스에서 가장 관련성 높은 문서 청크를 찾고, 이를 원래의 질문과 함께 LLM에 맥락으로 제공함으로써 구체적이고 사실에 기반한 답변을 생성한다 [3, 6, 12]. **RAG의 기술적 진화** * **Advanced RAG**: 단순한 '검색 후 생성'의 Naive RAG에서 발전하여, 하이브리드 검색, 문서 재순위화(Reranking), 쿼리 확장 등을 도입해 검색의 정밀도와 재현율을 높였다 [13-16]. * **자기 반성 및 수정 기능**: 검색의 필요성을 자체적으로 판단하고 검색된 문서의 적합성을 평가하여 스스로 답변을 수정하는 Self-RAG 및 CRAG(Corrective RAG) 기법이 도입되었다 [16, 17]. * **에이전틱 RAG(Agentic RAG) 및 GraphRAG**: 지식 그래프(Knowledge Graph)를 활용하여 엔티티 간의 관계를 추론하거나, AI 에이전트가 다단계 추론을 거쳐 자율적으로 검색 전략을 계획하고 실행하는 수준으로 고도화되고 있다 [15, 18-21]. **주요 활용 도메인** * 기업의 내부 지식 관리, 고객 지원, 법률/규정 준수 리서치, 의료 분야 등 부정확한 정보가 치명적일 수 있으며 최신 정보 및 출처의 추적 가능성이 필수적으로 요구되는 영역에서 탁월한 성능을 발휘한다 [22-25]. ## ⚖️ Trade-offs & Caveats * **인프라 및 통합의 복잡성**: RAG 시스템은 독립형 LLM 대비 고성능 임베딩 모델, 전문적인 벡터 데이터베이스, 견고한 검색 메커니즘 등 훨씬 복잡한 인프라 아키텍처를 요구하며, 기존 시스템과의 원활한 API 통합이 필요하다 [26, 27]. * **높은 컴퓨팅 및 운영 비용**: 데이터의 검색(Retrieval)과 텍스트 생성(Generation)이라는 두 가지 과정을 모두 수행해야 하므로 일반 LLM 사용이나 단순 키워드 검색보다 컴퓨팅 자원 소모가 크고 비용이 더 많이 든다 [27-29]. * **방대한 데이터 관리 부담**: 문서 청킹, 데이터 정리, 메타데이터 설계 등 광범위한 데이터 전처리가 필수적이며, 데이터가 변경될 때마다 오래된 정보를 인덱스에서 제거하고 지속적으로 최신 상태를 유지하는 작업이 까다롭다 [30, 31]. * **보안 및 거버넌스 취약성**: 검색 품질을 정량화하고 모니터링하기가 더 복잡하며, 조작된 악성 문서를 삽입하여 모델의 특정 행동을 유발하는 보안 공격(예: BadRAG, TrojanRAG)의 위험이 존재하여 검색 레이어에서의 접근 제어와 검증이 필수적이다 [27, 32-34]. --- *Last updated: 2026-05-04*