# [[RAG (Retrieval-Augmented Generation)]] ## πŸ“Œ Brief Summary RAG(검색 증강 생성)λŠ” λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 ν…μŠ€νŠΈ 생성 λŠ₯λ ₯에 μ™ΈλΆ€ 지식 검색 μ‹œμŠ€ν…œμ„ κ²°ν•©ν•˜μ—¬ μ‘λ‹΅μ˜ μ •ν™•μ„±κ³Ό 관련성을 λ†’μ΄λŠ” AI μ•„ν‚€ν…μ²˜μ΄λ‹€ [1]. λͺ¨λΈμ΄ μ‚¬μš©μž μ§ˆμ˜μ— λ‹΅λ³€ν•˜κΈ° 전에 μ™ΈλΆ€ 지식 λ² μ΄μŠ€λ‚˜ λ¬Έμ„œμ—μ„œ κ΄€λ ¨ 정보λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ κ²€μƒ‰ν•œ ν›„, 이λ₯Ό μ»¨ν…μŠ€νŠΈλ‘œ ν™œμš©ν•˜μ—¬ 닡변을 μƒμ„±ν•˜λ„λ‘ μ§€μ›ν•œλ‹€ [2-4]. 이λ₯Ό 톡해 사전 ν•™μŠ΅λœ λͺ¨λΈμ˜ 지식 λ‹¨μ ˆ 문제λ₯Ό ν•΄κ²°ν•˜κ³  ν™˜κ°(Hallucination) ν˜„μƒμ„ 크게 μ€„μž„μœΌλ‘œμ¨, κΈ°μ—… λ‚΄λΆ€ λ°μ΄ν„°λ‚˜ μ΅œμ‹  사싀에 κΈ°λ°˜ν•œ μ‹ λ’°ν•  수 μžˆλŠ” 정보λ₯Ό μ œκ³΅ν•˜λŠ” 핡심 기술둜 ν™œμš©λ˜κ³  μžˆλ‹€ [5-7]. ## πŸ“– Core Content * **νŒŒμ΄ν”„λΌμΈ 및 μž‘λ™ 원리** * **데이터 μˆ˜μ§‘ 및 μž„λ² λ”©(Document Ingestion & Embedding):** κ΅¬μ‘°ν™”λ˜κ±°λ‚˜ κ΅¬μ‘°ν™”λ˜μ§€ μ•Šμ€ λ‹€μ–‘ν•œ ν˜•νƒœμ˜ λ¬Έμ„œλ₯Ό μˆ˜μ§‘ν•˜μ—¬ μ μ ˆν•œ 크기둜 λ‚˜λˆ„λŠ” μ§€λŠ₯ν˜• μ²­ν‚Ή(Intelligent Chunking)을 μˆ˜ν–‰ν•˜κ³ , μž„λ² λ”© λͺ¨λΈμ„ 톡해 λ¬Έλ§₯적 의미λ₯Ό 담은 고차원 λ²‘ν„°λ‘œ λ³€ν™˜ν•˜μ—¬ 벑터 λ°μ΄ν„°λ² μ΄μŠ€μ— μ €μž₯ν•œλ‹€ [8-12]. * **검색 및 μž¬μˆœμœ„ν™”(Retrieval & Reranking):** μ‚¬μš©μžμ˜ 질의λ₯Ό λ²‘ν„°λ‘œ λ³€ν™˜ν•œ ν›„ 코사인 μœ μ‚¬λ„ 등을 μ΄μš©ν•΄ κ°€μž₯ κ΄€λ ¨μ„± 높은 λ¬Έμ„œλ₯Ό κ²€μƒ‰ν•œλ‹€ [11]. 정확도λ₯Ό κ·ΉλŒ€ν™”ν•˜κΈ° μœ„ν•΄ 의미둠적 벑터 검색(Dense Retrieval)κ³Ό ν‚€μ›Œλ“œ 기반 λ§€μΉ­(Sparse/BM25)을 κ²°ν•©ν•œ ν•˜μ΄λΈŒλ¦¬λ“œ 검색(Hybrid Search) μ „λž΅μ„ μ‚¬μš©ν•˜λ©°, μΆ”μΆœλœ 후보 λ¬Έμ„œλ“€ 쀑 LLM 생성에 κ°€μž₯ μ ν•©ν•œ λ¬Έμ„œλ₯Ό λ‹€μ‹œ κ³ λ₯΄λŠ” μž¬μˆœμœ„ν™”(Reranking) 과정을 κ±°μΉœλ‹€ [12, 13]. * **μ»¨ν…μŠ€νŠΈ 쑰립 및 ν”„λ‘¬ν”„νŠΈ 생성(Prompt Engineering & Generation):** κ²€μƒ‰λœ 정보와 μ›λž˜μ˜ μ‚¬μš©μž 질의λ₯Ό κ²°ν•©ν•˜μ—¬ ν”„λ‘¬ν”„νŠΈλ₯Ό κ΅¬μ„±ν•˜κ³ , 이λ₯Ό LLM에 μ „λ‹¬ν•˜μ—¬ μΆœμ²˜κ°€ λͺ…ν™•ν•˜κ³  사싀에 κ·Όκ±°ν•œ μ΅œμ’… 닡변을 μƒμ„±ν•œλ‹€ [2, 3, 14, 15]. * **μ£Όμš” 이점** * **μ§€μ‹μ˜ ν•œκ³„ 극볡:** ν‘œμ€€ LLM이 κ°–λŠ” 지식 μ»·μ˜€ν”„(Knowledge Cutoff) 문제λ₯Ό ν•΄κ²°ν•˜μ—¬ μ΅œμ‹  μ‹œμž₯ λ°μ΄ν„°λ‚˜ κΈ°μ—…μ˜ λ‚΄λΆ€ 독점 지식에 λŒ€ν•œ 접근을 κ°€λŠ₯ν•˜κ²Œ ν•œλ‹€ [5, 16, 17]. * **ν™˜κ° λ°©μ§€ 및 투λͺ…μ„±:** λ‹΅λ³€μ˜ κ·Όκ±°κ°€ λ˜λŠ” μ™ΈλΆ€ λ¬Έμ„œλ₯Ό λͺ…μ‹œν•˜μ—¬ LLM의 ν™˜κ°(Hallucination) λΉ„μœ¨μ„ 42~68%κΉŒμ§€ κ°μ†Œμ‹œν‚€λ©°, 좜처 좔적 κΈ°λŠ₯을 μ œκ³΅ν•΄ 높은 신뒰도와 감사 κ°€λŠ₯μ„±(Auditability)을 보μž₯ν•œλ‹€ [5, 7, 18, 19]. * **기술의 μ§„ν™” 및 μ΅œμ‹  동ν–₯** * 초기의 λ‹¨μˆœν•œ 검색-생성 ꡬ쑰(Naive RAG)μ—μ„œ λ²—μ–΄λ‚˜, μ‹œμŠ€ν…œ 슀슀둜 κ²€μƒ‰μ˜ ν•„μš”μ„±κ³Ό κ²€μƒ‰λœ λ¬Έμ„œμ˜ 적합성을 ν‰κ°€ν•˜λŠ” μžκ°€ λ°˜μ„±ν˜•(Self-Reflective RAG), 개체 관계λ₯Ό νŒŒμ•…ν•˜λŠ” GraphRAG λ“±μœΌλ‘œ μ§„ν™”ν•˜κ³  μžˆλ‹€ [12, 20-24]. * 특히 검색 도ꡬλ₯Ό 자율적으둜 μ„ νƒν•˜κ³  닀단계 논리적 좔둠을 μˆ˜ν–‰ν•˜λŠ” '에이전틱 RAG(Agentic RAG)'둜 λ°œμ „ν•˜λ©°, λ‹¨μˆœ 정보 전달을 λ„˜μ–΄ μ‚¬μš©μžμ˜ λ³΅μž‘ν•œ μš”κ΅¬μ‚¬ν•­μ„ μˆ˜ν–‰ν•˜λŠ” μ§€λŠ₯ν˜• λΉ„μ„œλ‘œ 자리 작고 μžˆλ‹€ [12, 22, 25]. ## βš–οΈ Trade-offs & Caveats * **인프라 λ³΅μž‘μ„± 및 μ»΄ν“¨νŒ… λΉ„μš© 증가** * RAG μ•„ν‚€ν…μ²˜λŠ” ν…μŠ€νŠΈλ§Œ μƒμ„±ν•˜λŠ” κΈ°μ‘΄ LLM에 λΉ„ν•΄ λ³΅μž‘ν•œ 인프라(벑터 λ°μ΄ν„°λ² μ΄μŠ€, μž„λ² λ”© λͺ¨λΈ λ“±) ꡬ좕을 ν•„μš”λ‘œ ν•œλ‹€ [26, 27]. * λ¬Έμ„œ μ „μ²˜λ¦¬, μ‹€μ‹œκ°„ 검색, μƒμ„±μ΄λΌλŠ” 이쀑 과정을 μˆ˜ν–‰ν•΄μ•Ό ν•˜λ―€λ‘œ μ»΄ν“¨νŒ… λ¦¬μ†ŒμŠ€ μ†Œλͺ¨μ™€ μ§€μ—° μ‹œκ°„(Latency)이 λŠ˜μ–΄λ‚œλ‹€ [28, 29]. 특히 GraphRAG와 같은 지식 κ·Έλž˜ν”„ 기반의 검색은 μ—”ν‹°ν‹° 인식 및 κ·Έλž˜ν”„ ꡬ좕 λΉ„μš©μ΄ κΈ°μ€€ RAG νŒŒμ΄ν”„λΌμΈμ— λΉ„ν•΄ 3~5λ°° 더 λ§Žμ€ λΉ„μš©μ„ μ΄ˆλž˜ν•  수 μžˆλ‹€ [23, 30]. * **검색 ν’ˆμ§ˆμ— λŒ€ν•œ μ ˆλŒ€μ  μ˜μ‘΄λ„** * μ΅œμ’… 결과물의 ν’ˆμ§ˆμ€ μ „μ μœΌλ‘œ 검색 λ©”μ»€λ‹ˆμ¦˜μ˜ 정밀도와 μž¬ν˜„μœ¨μ— 달렀 μžˆλ‹€ [20, 31]. λ§Œμ•½ λ¬Έμ„œ 검색에 μ‹€νŒ¨ν•˜κ±°λ‚˜, λ§₯락에 λ§žμ§€ μ•ŠλŠ” λ…Έμ΄μ¦ˆκ°€ ν¬ν•¨λœ λ¬Έμ„œλ₯Ό κ°€μ Έμ˜€κ²Œ 되면 LLM의 ν™˜κ°μ„ μ™„μ „νžˆ μ œμ–΄ν•  수 μ—†λ‹€ [32, 33]. * μžμœ¨ν˜• μ—μ΄μ „νŠΈ(Agentic RAG) ν™˜κ²½μ—μ„œλŠ” μ‹œμŠ€ν…œμ΄ 정보λ₯Ό μ°ΎλŠ” κ³Όμ •μ—μ„œ λ¬΄ν•œ 검색 루프에 λΉ μ§€κ±°λ‚˜ λΆ€μ μ ˆν•œ 검색 결정을 λ‚΄λ¦¬λŠ” μ‹€νŒ¨ 사둀가 λ°œμƒν•  수 μžˆλ‹€ [34, 35]. * **λ³΄μ•ˆ 취약점 및 데이터 κ±°λ²„λ„ŒμŠ€ ν•œκ³„** * 검색 계측 μžμ²΄μ— λŒ€ν•œ μ ‘κ·Ό μ œμ–΄(Access Control)κ°€ μ™„λ²½ν•˜μ§€ μ•ŠμœΌλ©΄, λ²‘ν„°ν™”λœ λ¬Έμ„œλ‚˜ 검색 κ²°κ³Όμ—μ„œ μ‚¬μš©μžκ°€ μ—΄λžŒ κΆŒν•œμ΄ μ—†λŠ” λ―Όκ°ν•œ 데이터가 λ…ΈμΆœλ  수 μžˆλŠ” 치λͺ…적인 λ³΄μ•ˆ ν—ˆμ μ΄ 생긴닀 [36, 37]. * μ•…μ˜μ μœΌλ‘œ μ‘°μž‘λœ λ¬Έμ„œκ°€ 검색 결과에 μœ μž…λ  경우, LLM의 μ˜€μž‘λ™μ„ μœ λ°œν•˜λŠ” 'BadRAG'λ‚˜ 'TrojanRAG' ν˜•νƒœμ˜ 백도어 곡격 μœ„ν—˜μ΄ μ‘΄μž¬ν•œλ‹€ [34, 38]. μ΄λŸ¬ν•œ 곡격을 λ°©μ–΄ν•˜κΈ° μœ„ν•œ 검증 μ²΄κ³„λ‚˜ 감사 둜그 생성 κΈ°λŠ₯을 μΆ”κ°€ν•˜λ©΄ 응닡 지연이 5~10% μΆ”κ°€λ‘œ λ°œμƒν•œλ‹€ [37, 38]. --- *Last updated: 2026-05-04*