# [[Adaptive RAG]] ## πŸ“Œ Brief Summary Adaptive RAG(μ μ‘ν˜• RAG)λŠ” μ‚¬μš©μžμ˜ 질의(Query) λ³΅μž‘μ„±μ— 따라 검색(Retrieval) μ „λž΅κ³Ό 깊이λ₯Ό λ™μ μœΌλ‘œ μ‘°μ ˆν•˜λŠ” λ°œμ „λœ ν˜•νƒœμ˜ 검색 증강 생성 μ‹œμŠ€ν…œμž…λ‹ˆλ‹€ [1, 2]. λ‹¨μˆœν•œ μ§ˆμ˜μ—λŠ” 검색을 μƒλž΅ν•˜κ±°λ‚˜ μ΅œμ†Œν•œμ˜ 단일 κ²€μƒ‰λ§Œμ„ μˆ˜ν–‰ν•˜λŠ” 반면, λ³΅μž‘ν•œ μ§ˆλ¬Έμ—λŠ” 닀단계 검색과 μΆ”λ‘  체인을 κ°€λ™ν•©λ‹ˆλ‹€ [1, 2]. 이λ₯Ό 톡해 λΆˆν•„μš”ν•œ κ±°λŒ€ μ–Έμ–΄ λͺ¨λΈ(LLM) 호좜 및 μ—°μ‚° λΉ„μš©μ„ μ€„μ΄λŠ” λ™μ‹œμ— λ‹΅λ³€μ˜ μ™„μ „μ„±κ³Ό 정확성을 λ†’μ΄λŠ” 것이 핡심 λͺ©μ μž…λ‹ˆλ‹€ [3]. ## πŸ“– Core Content * **질의 λ³΅μž‘μ„±μ— λ”°λ₯Έ 동적 검색 μ „λž΅ (Dynamic Retrieval Strategy)** Adaptive RAGλŠ” κ³ μ •λœ 숫자의 λ¬Έμ„œλ₯Ό κ°€μ Έμ˜€λŠ” 기쑴의 'μƒμœ„ K개(Top-K)' 검색 νŒ¨λŸ¬λ‹€μž„μ„ λ²—μ–΄λ‚˜, 질의의 μˆ˜μ€€μ— 맞좰 검색 방식을 μ„ΈλΆ„ν™”ν•˜μ—¬ μ μš©ν•©λ‹ˆλ‹€ [3]. * **λ‹¨μˆœ 질의 (Simple queries):** λ‹¨μˆœν•œ 사싀 확인 질문의 경우, μ™ΈλΆ€ 정보 검색 없이 LLM이 직접 응닡을 μƒμ„±ν•˜κ±°λ‚˜ 1회의 벑터 검색(Single-hop retrieval)λ§Œμ„ μˆ˜ν–‰ν•˜μ—¬ μ‹ μ†ν•˜κ²Œ μ²˜λ¦¬ν•©λ‹ˆλ‹€ [1-3]. * **쀑간 λ³΅μž‘μ„± 질의 (Medium complexity):** 일반적인 정보 탐색이 ν•„μš”ν•œ 경우, ν‘œμ€€μ μΈ RAG νŒŒμ΄ν”„λΌμΈμ„ 거쳐 닡변을 μƒμ„±ν•©λ‹ˆλ‹€ [1]. * **λ³΅μž‘ν•œ 질의 (Complex multi-hop):** λ‹€κ°λ„μ˜ λΆ„μ„μ΄λ‚˜ 논리적 좔둠이 ν•„μš”ν•œ μ§ˆμ˜μ—λŠ” 닀단계 검색(Multi-stage retrieval), 의미둠적 μž¬μˆœμœ„ν™”(Semantic re-ranking), 개체 κ·Έλž˜ν”„ 탐색(Entity-graph traversal), μ‹œκ°„μ  필터링 등을 κ²°ν•©ν•œ 반볡적 검색 및 μΆ”λ‘  체인을 ν™œμš©ν•©λ‹ˆλ‹€ [1-3]. * **기계 ν•™μŠ΅μ„ ν†΅ν•œ μ‹œμŠ€ν…œ μ΅œμ ν™”** μ΄λŸ¬ν•œ μ μ‘ν˜• μ‹œμŠ€ν…œμ€ κ°•ν™”ν•™μŠ΅(Reinforcement learning) 등을 톡해 질의 μœ ν˜•λ³„λ‘œ 졜적의 검색 깊이λ₯Ό 슀슀둜 ν•™μŠ΅ν•  수 μžˆλ„λ‘ μ„€κ³„λ©λ‹ˆλ‹€ [3]. * **λΉ„μš© 및 μ„±λŠ₯의 νš¨μœ¨ν™”** 질의 λ³΅μž‘μ„±μ— 맞좰 검색 μ „λž΅μ„ μœ μ—°ν•˜κ²Œ μ‘°μ •ν•¨μœΌλ‘œμ¨, λΆˆν•„μš”ν•œ LLM ν˜ΈμΆœμ„ 쀄여 κΈ°μ—…μ˜ 운영 λΉ„μš©μ„ μ ˆκ°ν•˜λ©΄μ„œλ„ μ‚¬μš©μžκ°€ μš”κ΅¬ν•˜λŠ” μˆ˜μ€€μ˜ μ™„μ „ν•œ 닡변을 μ œκ³΅ν•  수 μžˆμŠ΅λ‹ˆλ‹€ [3]. ## βš–οΈ Trade-offs & Caveats * **λΆ€μ μ ˆν•œ 검색 깊이 νŒλ³„ μœ„ν—˜** Adaptive RAG λͺ¨λΈμ΄ 질의의 λ³΅μž‘μ„±μ„ 잘λͺ» νŒλ‹¨ν•  경우, λ³΅μž‘ν•œ μ§ˆμ˜μ— λŒ€ν•΄ λ„ˆλ¬΄ 적은 수의 λ¬Έμ„œλ₯Ό κ²€μƒ‰ν•˜μ—¬ 정보가 λˆ„λ½λ˜κ±°λ‚˜ λ‹¨μˆœν•œ μ§ˆμ˜μ— κ³Όλ„ν•˜κ²Œ λ¬Έμ„œλ₯Ό κ²€μƒ‰ν•˜μ—¬ λ¦¬μ†ŒμŠ€λ₯Ό λ‚­λΉ„ν•˜λŠ” λ“±μ˜ 였λ₯˜(Failure mode)κ°€ λ°œμƒν•  수 μžˆμŠ΅λ‹ˆλ‹€ [4]. * **ν’ˆμ§ˆ 관리 및 μΆ”κ°€ μ‹œμŠ€ν…œ κ΅¬μΆ•μ˜ ν•„μš”μ„±** μ΄λŸ¬ν•œ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄μ„œλŠ” λ‹΅λ³€μ˜ 완전성을 μ§€μ†μ μœΌλ‘œ ν‰κ°€ν•˜κ³ , μ •λ³΄μ˜ 곡백이 감지될 경우 좔가적인 검색을 μœ λ„ν•˜λŠ” '검색 ν’ˆμ§ˆ 게이트(Retrieval quality gates)'λ₯Ό λ„μž…ν•΄μ•Ό ν•©λ‹ˆλ‹€ [4]. * **λͺ¨λΈ μœ μ§€λ³΄μˆ˜ λΆ€λ‹΄ 증가** 였λ₯˜λ₯Ό μ΅œμ†Œν™”ν•˜κΈ° μœ„ν•΄ μ‹€μ œ ν”„λ‘œλ•μ…˜ νŠΈλž˜ν”½ 데이터λ₯Ό λ°”νƒ•μœΌλ‘œ ν›ˆλ ¨λœ 질의 λ³΅μž‘μ„± λΆ„λ₯˜κΈ°(Query complexity classifiers)λ₯Ό μ§€μ†μ μœΌλ‘œ μœ μ§€ν•˜κ³  관리해야 ν•˜λŠ” 기술적, 운영적 뢀담이 λ°œμƒν•©λ‹ˆλ‹€ [4]. --- *Last updated: 2026-05-04*