# [[์ž๊ธฐ ๋ฐ˜์„ฑ (Self-Reflection / Self-RAG)]] ## ๐Ÿ“Œ Brief Summary ์ž๊ธฐ ๋ฐ˜์„ฑ(Self-Reflective RAG, ๋˜๋Š” Self-RAG)์€ ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์ด ์ž์ฒด์ ์ธ ๊ฒ€์ƒ‰ ๋ฐ ์ƒ์„ฑ ํ’ˆ์งˆ์„ ์Šค์Šค๋กœ ํ‰๊ฐ€ํ•˜๊ณ  ๊ฒ€ํ† ํ•˜๋Š” ๊ณ ๊ธ‰ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ ์•„ํ‚คํ…์ฒ˜์ด๋‹ค [1, 2]. ๊ณ ์ •๋œ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋”ฐ๋ฅด๋Š” ๋Œ€์‹ , ์ •๋ณด ๊ฒ€์ƒ‰ ์‹œ์ ์„ ์Šค์Šค๋กœ ๊ฒฐ์ •ํ•˜๊ณ  ๊ฒ€์ƒ‰๋œ ์ฝ˜ํ…์ธ ์˜ ๊ด€๋ จ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋ฉฐ ์ž์‹ ์˜ ์ถœ๋ ฅ๋ฌผ์„ ๋น„ํŒ์ ์œผ๋กœ ๋ถ„์„ํ•˜๋Š” ๋™์ ์ด๊ณ  ์กฐ๊ฑด๋ถ€์ ์ธ ๊ฒ€์ƒ‰์„ ์ˆ˜ํ–‰ํ•œ๋‹ค [2]. ์ด๋ฅผ ํ†ตํ•ด ์‹œ์Šคํ…œ์€ ์ •๋ณด์˜ ๊ณต๋ฐฑ์„ ์‹๋ณ„ํ•˜๊ณ  ์‹ ๋ขฐ๋„๊ฐ€ ๋‚ฎ์„ ๋•Œ ์ถ”๊ฐ€ ๊ฒ€์ƒ‰์„ ์‹คํ–‰ํ•˜์—ฌ ์‘๋‹ต์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ๊ฐœ์„ ํ•จ์œผ๋กœ์จ AI์˜ ํ™˜๊ฐ(Hallucination)์„ ํฌ๊ฒŒ ์ค„์ธ๋‹ค [1, 3, 4]. ## ๐Ÿ“– Core Content * **์ž์ฒด ํ‰๊ฐ€ ๋ฐ ๊ฒ€์ฆ ๋ฉ”์ปค๋‹ˆ์ฆ˜ (Self-Reflective Mechanisms)** Self-RAG ์‹œ์Šคํ…œ์€ ๊ณ ๋„ํ™”๋œ ๋‹ต๋ณ€ ์ƒ์„ฑ์„ ์œ„ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ž์ฒด ํ‰๊ฐ€ ๊ณผ์ •์„ ๊ฑฐ์นœ๋‹ค [1]. * **๊ฒ€์ƒ‰ ํ•„์š”์„ฑ ๊ฐ์ง€ (Retrieval necessity detection):** ๋ชจ๋ธ์ด ์™ธ๋ถ€ ์ •๋ณด์˜ ๊ฐœ์ž…์ด ์–ธ์ œ๊ฐ€ ํ•„์š”ํ•œ์ง€ ์ž์œจ์ ์œผ๋กœ ๊ฒฐ์ •ํ•œ๋‹ค [1, 2]. * **๊ด€๋ จ์„ฑ ํ‰๊ฐ€ (Relevance assessment):** ๊ฒ€์ƒ‰๋œ ๋ฌธ์„œ๊ฐ€ ์‚ฌ์šฉ์ž์˜ ์ฟผ๋ฆฌ์— ์œ ์šฉํ•œ์ง€ ํ‰๊ฐ€ํ•œ๋‹ค [1, 2]. * **์ž์ฒด ๋น„ํŒ ๋ฐ ๋ถ„์„ (Self-critique):** ์ƒ์„ฑ๋œ ์‘๋‹ต์˜ ์ •ํ™•์„ฑ์„ ์Šค์Šค๋กœ ๋ถ„์„ํ•˜๊ณ  ํ‰๊ฐ€ํ•œ๋‹ค [1, 2]. * **๋™์  ๋ฐ ๋ฐ˜๋ณต์  ๊ฒ€์ƒ‰ ๊ฐœ์„ ** ๋‹จ์ˆœํ•œ ๋‹จ์ผ ๋‹จ๊ณ„์˜ ๊ณ ์ •๋œ '๊ฒ€์ƒ‰ ๋ฐ ์ƒ์„ฑ' ๊ตฌ์กฐ์—์„œ ๋ฒ—์–ด๋‚˜, ๊ฒ€์ƒ‰์„ ๋™์ ์ด๊ณ  ์กฐ๊ฑด๋ถ€์ ์ธ ์ž‘์—…์œผ๋กœ ์ทจ๊ธ‰ํ•œ๋‹ค [2]. ์ค‘๊ฐ„ ๊ฒฐ๊ณผ๋ฌผ์„ ํ‰๊ฐ€ํ•œ ํ›„ ์ •๋ณด์— ๊ณต๋ฐฑ์ด ์žˆ๊ฑฐ๋‚˜ ์‹ ๋ขฐ๋„๊ฐ€ ๋‚ฎ๋‹ค๊ณ  ํŒ๋‹จ๋˜๋ฉด ์ถ”๊ฐ€์ ์ธ ๊ฒ€์ƒ‰์„ ํŠธ๋ฆฌ๊ฑฐํ•˜์—ฌ ์‘๋‹ต์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ์„ธ๋ถ„ํ™”ํ•˜๊ณ  ๊ฐœ์„ (Iterative refinement)ํ•œ๋‹ค [1, 4]. * **๊ฒ€์ƒ‰ ์ •ํ™•๋„ ํ–ฅ์ƒ ๋ฐ ํ™˜๊ฐ ๊ฐ์†Œ** ์—์ด์ „ํŠธ๊ฐ€ ์ •๋ณด ์ˆ˜์ง‘ ์ „๋žต์„ ๊ณ„ํšํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฅผ ๊ด€์ฐฐํ•˜๋ฉฐ ์ ์‘ํ•˜๋Š” ์ž๊ฐ€ ๋ฐ˜์„ฑ ๊ธฐ๋Šฅ์€ ๋ฌด๊ด€ํ•œ ๊ฒ€์ƒ‰ ํšŸ์ˆ˜๋ฅผ 25~40%๊ฐ€๋Ÿ‰ ๊ฐ์†Œ์‹œํ‚ค๋Š” ํšจ๊ณผ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค [2]. ๋˜ํ•œ, ๊ฒ€์ƒ‰์„ ์กฐ๊ฑด๋ถ€๋กœ ์‹คํ–‰ํ•จ์œผ๋กœ์จ ๊ทผ๊ฑฐ ์—†๋Š” ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ํ™˜๊ฐ ํ˜„์ƒ์„ ํšจ๊ณผ์ ์œผ๋กœ ์ค„์—ฌ์ค€๋‹ค [3]. ## โš–๏ธ Trade-offs & Caveats * **๋ฌดํ•œ ๊ฒ€์ƒ‰ ๋ฃจํ”„ (Infinite Retrieval Loops) ๋ฐ ๊ณผ๋„ํ•œ ๊ฒ€์ƒ‰** ์‹œ์Šคํ…œ์˜ ์‹ ๋ขฐ๋„ ๋ณด์ •(Confidence calibration)์ด ์‹คํŒจํ•  ๊ฒฝ์šฐ, ๋ช…ํ™•ํ•œ ๋‹ต์— ์ˆ˜๋ ดํ•˜์ง€ ๋ชปํ•œ ์ฑ„ ์œ ์‚ฌํ•œ ์ •๋ณด๋งŒ ์ง€์†์ ์œผ๋กœ ๊ฐ€์ ธ์˜ค๋Š” ๋ฌดํ•œ ๊ฒ€์ƒ‰ ๋ฃจํ”„์— ๋น ์ง€๊ฑฐ๋‚˜ ๊ณผ๋„ํ•œ ๊ฒ€์ƒ‰(Over-retrieval)์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์น˜๋ช…์ ์ธ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค [2, 5]. ์ด๋ฅผ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ฟผ๋ฆฌ๋‹น ์ตœ๋Œ€ ๊ฒ€์ƒ‰ ์˜ˆ์‚ฐ(์ œํ•œ)์„ ์„ค์ •ํ•˜๊ณ , ๋ฃจํ”„ ๊ฐ์ง€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๋„์ž…ํ•ด์•ผ ํ•œ๋‹ค [5]. * **์ž˜๋ชป๋œ ๊ฒ€์ƒ‰ ๊ฒฐ์ • (Incorrect Retrieval Decisions)** ์Šค์Šค๋กœ ๊ฒ€์ƒ‰ ์—ฌ๋ถ€์™€ ๊ด€๋ จ์„ฑ์„ ํŒ๋‹จํ•˜๋Š” ์ž์œจ์„ฑ์— ์˜์กดํ•˜๋ฏ€๋กœ, ํŒ๋‹จ ๊ธฐ์ค€์ด ๋ถ€์ •ํ™•ํ•  ๊ฒฝ์šฐ ์ž˜๋ชป๋œ ๊ฒ€์ƒ‰ ๊ฒฐ์ •์„ ๋‚ด๋ฆด ๊ฐ€๋Šฅ์„ฑ์ด ์กด์žฌํ•œ๋‹ค [2]. * **๊ฐ์‚ฌ(Auditing) ๋ฐ ํˆฌ๋ช…์„ฑ ๋ถ€์กฑ** ์—์ด์ „ํŠธ๊ฐ€ ์–ด๋– ํ•œ ๊ทผ๊ฑฐ๋กœ ๊ฒ€์ƒ‰ ๊ฒฐ์ •์„ ๋‚ด๋ ธ๋Š”์ง€ ๊ทธ ์ถ”๋ก  ๊ณผ์ •์ด ๋ถˆํˆฌ๋ช…(Opaque)ํ•ด์งˆ ์ˆ˜ ์žˆ๋‹ค [5]. ํŠนํžˆ ๊ทœ์ œ๊ฐ€ ์—„๊ฒฉํ•œ ์‚ฐ์—…์—์„œ๋Š” ์—์ด์ „ํŠธ์˜ ๊ฒ€์ƒ‰ ๊ฒฐ์ •์„ ๊ฐ์‚ฌํ•˜๊ธฐ ์œ„ํ•œ ํ‘œ์ค€ํ™”๋œ ๋ฐฉ๋ฒ•์ด ์•„์ง ๋ถ€์žฌํ•˜๋ฏ€๋กœ, ๊ฒฐ์ • ๊ณผ์ •์„ ์ถ”์ ํ•  ์ˆ˜ ์žˆ๋Š” ๊ตฌ์กฐํ™”๋œ ๋กœ๊น… ๊ธฐ๋Šฅ๊ณผ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„๊ฐ€ ํ•„์ˆ˜์ ์œผ๋กœ ์š”๊ตฌ๋œ๋‹ค [3, 5]. --- *Last updated: 2026-05-04*