# [[Agentic RAG]] ## ๐Ÿ“Œ Brief Summary ์—์ด์ „ํ‹ฑ RAG(Agentic RAG)๋Š” ๊ณ ์ •๋œ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋”ฐ๋ฅด๋Š” ๊ธฐ์กด์˜ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ๋ฐฉ์‹์—์„œ ๋ฒ—์–ด๋‚˜, ์‹œ์Šคํ…œ์ด ์Šค์Šค๋กœ ์‚ฌ๊ณ ํ•˜๊ณ  ํ–‰๋™ํ•˜๋Š” ์ž์œจ์ ์ธ ์˜์‚ฌ๊ฒฐ์ • ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ์ง„ํ™”๋œ ์•„ํ‚คํ…์ฒ˜์ž…๋‹ˆ๋‹ค [1, 2]. ์ด ์‹œ์Šคํ…œ์€ ๋‹ค๋‹จ๊ณ„ ๊ฒ€์ƒ‰ ์ „๋žต์„ ๊ณ„ํšํ•˜๊ณ , ๋ฌด์—‡์„ ์–ธ์ œ ๊ฒ€์ƒ‰ํ• ์ง€ ๊ฒฐ์ •ํ•˜๋ฉฐ, ์ค‘๊ฐ„ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์งˆ์˜๋ฅผ ๋ฐ˜๋ณตํ•˜๊ฑฐ๋‚˜ ๋‹ค์–‘ํ•œ ์ถœ์ฒ˜์˜ ์ •๋ณด๋ฅผ ํ•ฉ์„ฑํ•ฉ๋‹ˆ๋‹ค [1, 3]. ๊ถ๊ทน์ ์œผ๋กœ ๋‹จ์ˆœํ•œ ์ •๋ณด '์ „๋‹ฌ' ๋„๊ตฌ๋ฅผ ๋„˜์–ด, ๋…ผ๋ฆฌ์  ์ถ”๋ก ์„ ํ†ตํ•ด ๋ชจ์ˆœ์„ ํ•ด๊ฒฐํ•˜๊ณ  ์‚ฌ์šฉ์ž์˜ ๋ณต์žกํ•œ ์š”๊ตฌ์‚ฌํ•ญ์„ ์ž์œจ์ ์œผ๋กœ '์ˆ˜ํ–‰'ํ•˜๋Š” ์ง€๋Šฅํ˜• ๋น„์„œ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค [2, 4]. ## ๐Ÿ“– Core Content * **์ž์œจ์  ์˜์‚ฌ๊ฒฐ์ •๊ณผ ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก :** ์—์ด์ „ํ‹ฑ RAG๋Š” ๋‹จ์ˆœํ•œ '๊ฒ€์ƒ‰ ํ›„ ์ƒ์„ฑ(Retrieve and Generate)'์˜ ๋‹จ์ผ ๋‹จ๊ณ„๋ฅผ ๋„˜์–ด ์ž์œจ์ ์ธ ๊ฒฐ์ •๊ถŒ์„ ๊ฐ–์Šต๋‹ˆ๋‹ค [1, 5]. ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์ด ๋ชจํ˜ธํ•  ๊ฒฝ์šฐ ๋˜๋ฌป๊ฑฐ๋‚˜, ๊ฒ€์ƒ‰๋œ ์ •๋ณด๊ฐ€ ๋ถ€์กฑํ•˜๋‹ค๊ณ  ํŒ๋‹จ๋˜๋ฉด ์ถ”๊ฐ€ ๊ฒ€์ƒ‰์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, ์ •๋ณด ๊ฐ„์˜ ์ถฉ๋Œ์ด ๋ฐœ์ƒํ•  ๊ฒฝ์šฐ ๋…ผ๋ฆฌ์  ์ถ”๋ก ์„ ํ†ตํ•ด ๋ชจ์ˆœ์„ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค [2]. ์ด๋ฅผ ํ†ตํ•ด ๋Œ€๊ทœ๋ชจ ์ง€์‹ ๊ธฐ๋ฐ˜ ์ „๋ฐ˜์— ๊ฑธ์นœ ๋ณต์žกํ•˜๊ณ  ๋‹ค๋‹จ๊ณ„์ ์ธ ์ถ”๋ก (Multi-step reasoning)์„ ์™„๋ฒฝํ•˜๊ฒŒ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค [1]. * **๋‹ค์ค‘ ์—์ด์ „ํŠธ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜(Multi-Agent Orchestration):** ๋ณต์žกํ•œ ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ํŠนํ™”๋œ ์—์ด์ „ํŠธ๊ฐ€ ํ˜‘๋ ฅํ•˜๋Š” ์‹œ์Šคํ…œ์œผ๋กœ ์ง„ํ™”ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค [5]. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ •๋ณด ๊ณต๊ฐ„์„ ํƒ์ƒ‰ํ•˜๋Š” '๋ฆฌ์„œ์น˜ ์—์ด์ „ํŠธ', ๊ถŒ์œ„ ์žˆ๋Š” ์ถœ์ฒ˜๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์‚ฌ์‹ค์„ ํ™•์ธํ•˜๋Š” '๊ฒ€์ฆ ์—์ด์ „ํŠธ', ๊ฒฐ๊ณผ๋ฅผ ๊ฒฐํ•ฉํ•˜๋Š” 'ํ•ฉ์„ฑ ์—์ด์ „ํŠธ', ๊ทธ๋ฆฌ๊ณ  ์ ‘๊ทผ ์ •์ฑ… ์ค€์ˆ˜๋ฅผ ๋ณด์žฅํ•˜๋Š” '๊ฑฐ๋ฒ„๋„Œ์Šค ์—์ด์ „ํŠธ'๊ฐ€ ๊ฐ์ž์˜ ์—ญํ• ์„ ์ˆ˜ํ–‰ํ•˜์—ฌ ๊ณ ๋„์˜ ์ง€์‹ ์ž‘์—…์„ ์™„์„ฑํ•ฉ๋‹ˆ๋‹ค [5]. * **๋„๊ตฌ ํ™œ์šฉ ๋ฐ ์ž๊ธฐ ๋ฐ˜์„ฑ(Self-Reflection):** ์—์ด์ „ํŠธ๋Š” ์ž‘์—… ์š”๊ตฌ์‚ฌํ•ญ์— ๋”ฐ๋ผ ๊ฒ€์ƒ‰, ๊ณ„์‚ฐ ๋ฐ ์ถ”๋ก  ๋„๊ตฌ๋ฅผ ๋Šฅ๋™์ ์œผ๋กœ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค [6]. ํ•˜๋“œ์ฝ”๋”ฉ๋œ ์›Œํฌํ”Œ๋กœ์šฐ ๋กœ์ง ์—†์ด๋„ ์Šค์Šค๋กœ ์ •๋ณด ์ˆ˜์ง‘ ์ „๋žต์„ ๊ณ„ํšํ•˜๊ณ , ๊ฒ€์ƒ‰ ์ž‘์—…์„ ์‹คํ–‰ํ•œ ๋’ค, ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๊ด€์ฐฐํ•˜๊ณ  ํ’ˆ์งˆ์„ ๋ฐ˜์„ฑ(Reflect)ํ•˜์—ฌ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์œ ์—ฐํ•˜๊ฒŒ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค [6]. ํ™•์‹ ์ด ๋‚ฎ์„ ๊ฒฝ์šฐ ์ •๋ณด์˜ ๊ณต๋ฐฑ์„ ํŒŒ์•…ํ•ด ์ถ”๊ฐ€ ๊ฒ€์ƒ‰์„ ํŠธ๋ฆฌ๊ฑฐํ•˜๋ฉฐ, API๋ฅผ ํ†ตํ•œ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์ด๋‚˜ ๊ตฌ์กฐํ™”๋œ ๋ณด๊ณ ์„œ ์ƒ์„ฑ๊นŒ์ง€ ์ง์ ‘ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [3, 6]. ## โš–๏ธ Trade-offs & Caveats * **๋ฌดํ•œ ๊ฒ€์ƒ‰ ๋ฃจํ”„(Infinite Retrieval Loops)์˜ ์œ„ํ—˜:** ์—์ด์ „ํŠธ๊ฐ€ ์ตœ์ข… ๋‹ต๋ณ€์— ์ˆ˜๋ ดํ•˜์ง€ ๋ชปํ•˜๊ณ  ์œ ์‚ฌํ•œ ์ •๋ณด๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ๊ฐ€์ ธ์˜ค๋Š” ๋ฌดํ•œ ๋ฃจํ”„์— ๋น ์งˆ ์ˆ˜ ์žˆ๋Š” ๋ถ€์ž‘์šฉ์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค [7]. ์ด๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ฟผ๋ฆฌ๋‹น ์ตœ๋Œ€ ๊ฒ€์ƒ‰ ์˜ˆ์‚ฐ(Maximum retrieval budgets)์„ ์„ค์ •ํ•˜๊ณ , ๋ฃจํ”„ ๊ฐ์ง€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ ์šฉํ•ด์•ผ ํ•˜๋ฉฐ, ์—์ด์ „ํŠธ๊ฐ€ ๊ฐ๊ฐ์˜ ๊ฒ€์ƒ‰ ํ–‰๋™์— ๋Œ€ํ•ด ์˜ˆ์ƒ๋˜๋Š” ์ •๋ณด ํš๋“๋Ÿ‰์„ ์ •๋‹นํ™”ํ•˜๋„๋ก ์š”๊ตฌํ•˜๋Š” ์ œ์•ฝ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค [7]. * **์ถ”๋ก  ๊ณผ์ •์˜ ๋ถˆํˆฌ๋ช…์„ฑ(Opaque Reasoning):** ์—์ด์ „ํŠธ์˜ ์ž์œจ์„ฑ์ด ๋†’์•„์ง์— ๋”ฐ๋ผ ์ถ”๋ก  ๊ณผ์ •์ด ๋ถˆํˆฌ๋ช…ํ•ด์ ธ ์‹œ์Šคํ…œ์ด ํŠน์ •ํ•œ ๊ฒ€์ƒ‰ ๊ฒฐ์ •์„ ๋‚ด๋ฆฐ ์ด์œ ๋ฅผ ๊ฐ์‚ฌ(Audit)ํ•˜๊ธฐ ์–ด๋ ค์›Œ์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [7]. ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ์™„ํ™”ํ•˜๋ ค๋ฉด ์—์ด์ „ํŠธ์˜ ์ถ”๋ก  ์‚ฌ์Šฌ(Reasoning chains)์— ๋Œ€ํ•œ ๊ตฌ์กฐํ™”๋œ ๋กœ๊น…์„ ์˜๋ฌดํ™”ํ•˜๊ณ , ๊ฒ€์ƒ‰ ํ–‰๋™์„ ๋น„์ฆˆ๋‹ˆ์Šค ๋กœ์ง๊ณผ ์—ฐ๊ฒฐํ•˜์—ฌ ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์„ ๊ตฌํ˜„ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค [7]. ๋˜ํ•œ, ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ๊ณ„ํš(Planning)๊ณผ ์‹คํ–‰(Execution)์„ ๋ถ„๋ฆฌํ•˜๋Š” ๋ฐฉ์‹์˜ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„๊ฐ€ ๋™๋ฐ˜๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค [7]. --- *Last updated: 2026-05-04*