2nd/01_Archive/2026-05-04/검색 증강 생성 (Retrieval-Augmented Generation, RAG).md

# [[검색 증강 생성 (Retrieval-Augmented Generation, RAG)]]

## 📌 Brief Summary
검색 증강 생성(RAG)은 대규모 언어 모델(LLM)의 생성 능력과 정보 검색 시스템을 결합하여, 외부 지식 소스에서 관련 정보를 실시간으로 검색하고 이를 질의에 증강시켜 답변을 생성하는 AI 아키텍처입니다 [1, 2]. 이 기술은 모델을 재학습시키지 않고도 기업의 내부 데이터나 최신 정보에 접근할 수 있게 해줍니다 [3, 4]. 이를 통해 기존 LLM의 고질적 한계인 환각(Hallucination) 현상을 크게 줄이고, 출처가 명확하며 도메인에 특화된 정확한 답변을 제공하는 것이 특징입니다 [1, 4, 5].

## 📖 Core Content
*   **RAG의 작동 방식 및 핵심 컴포넌트**
    *   RAG 시스템은 크게 검색(Retrieval) 메커니즘과 생성(Generation) 컴포넌트로 나뉘는 2단계 프로세스로 동작합니다 [6].
    *   **문서 수집 및 임베딩 (Ingestion & Embedding):** 다양한 포맷(PDF, DB 등)의 문서를 수집한 뒤, 이를 처리 가능한 크기로 나누는 청킹(Chunking)을 수행합니다 [7, 8]. 이후 임베딩 모델을 사용하여 텍스트 청크를 의미(Semantic)를 담은 고차원 벡터로 변환하여 벡터 데이터베이스(Pinecone, Weaviate 등)에 저장합니다 [8-11].
    *   **정보 검색 (Retrieval):** 사용자의 질의가 들어오면 이를 벡터로 변환하고, 코사인 유사도 등의 거리 측정 방식을 통해 벡터 데이터베이스에서 가장 의미가 유사한 문서 청크를 찾습니다 [11]. 최근에는 정확도를 높이기 위해 의미론적 조밀 벡터(Dense vector) 검색과 전통적인 키워드 기반 희소 검색(BM25 등)을 결합한 하이브리드 검색(Hybrid Search)이 널리 쓰입니다 [12-14].
    *   **프롬프트 조립 및 생성 (Prompt Engineering & Generation):** 검색된 관련 정보들과 원본 질의, 메타데이터 등을 결합하여 포괄적인 프롬프트를 구성합니다 [15, 16]. LLM은 이 강화된 프롬프트를 바탕으로 근거가 명확한 응답을 생성합니다 [6, 16, 17].

*   **RAG 아키텍처의 진화 (Advanced RAG)**
    *   **고급 RAG 기법:** 단순 검색 및 생성에 그쳤던 Naive RAG에서 발전하여, 현재는 검색된 결과의 순위를 다시 매기는 재순위화(Reranking), 쿼리 재작성, 지능적 청킹 전략을 활용해 검색 정확도를 높입니다 [13, 14, 18].
    *   **그래프 RAG (Graph RAG):** 텍스트를 단순 청크로 나누는 대신 지식 그래프(Knowledge Graph)를 구축하여 엔티티 간의 관계를 추론합니다. 이는 여러 문서에 걸친 복잡한 추론이나 포괄적인 주제를 파악하는 데 효과적입니다 [13, 19].
    *   **에이전틱 및 자가 반성 RAG (Agentic & Self-Reflective RAG):** 고정된 파이프라인을 따르지 않고, AI 스스로 외부 정보가 필요한지 판단하고, 검색된 문서의 적합성을 평가하며, 정보가 부족하면 추가 검색을 실행하는 다단계 추론(Multi-Hop Reasoning) 방식입니다 [13, 14, 20-22].

## ⚖️ Trade-offs & Caveats
*   **인프라 복잡성 및 리소스 비용:** RAG는 일반적인 LLM 단독 사용에 비해 벡터 데이터베이스, 전용 임베딩 모델, 정교한 검색 파이프라인 등 훨씬 복잡한 기술적 인프라가 요구됩니다 [23-25]. 데이터를 검색하고 텍스트를 생성하는 이중 프로세스를 거쳐야 하므로 컴퓨팅 리소스가 더 많이 소모되며, 실시간 쿼리 처리 시 지연 시간(Latency)이 증가할 수 있습니다 [26, 27].
*   **초기 모델(Naive RAG)의 한계:** 문맥을 무시한 단순 청킹이나 검색 단계의 실패 시, 관련 없는 내용이 포함되거나(Low precision) 필수 정보가 누락되어(Low recall) 모델이 잘못된 정보를 바탕으로 여전히 환각을 일으킬 위험이 있습니다 [18].
*   **고급 RAG 기법의 반대 급부:** GraphRAG를 위한 지식 그래프 추출 및 유지는 기본 RAG에 비해 3~5배 더 많은 비용(LLM 호출)이 들며, 엔티티 인식에서 노이즈가 발생할 수 있습니다 [19, 28]. Agentic RAG의 경우, 에이전트가 무한 검색 루프에 빠지거나 의사 결정 및 추론 과정이 불투명해져 규제 환경에서 감사(Audit)하기 어려워지는 단점이 존재합니다 [29].
*   **보안 및 무결성 취약점:** 조작되거나 오염된 문서를 검색 엔진이 참조하게 하여 LLM이 특정 오작동을 일으키게 만드는 공격 기법(BadRAG, TrojanRAG 등)에 취약할 수 있습니다. 따라서 엔터프라이즈 환경에서는 강력한 접근 제어, 데이터 출처 추적, 문서 유효성 검증 등의 방어 체계가 필수적으로 요구됩니다 [30-32].

---
*Last updated: 2026-05-04*