# [[์žฌ์ˆœ์œ„ํ™” (Reranking)]] ## ๐Ÿ“Œ Brief ์‹œ Summary ์žฌ์ˆœ์œ„ํ™”(Reranking)๋Š” ์ •๋ณด ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์—์„œ ๋น ๋ฅด๊ณ  ๋‹จ์ˆœํ•œ 1๋‹จ๊ณ„ ์ดˆ๊ธฐ ๊ฒ€์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋ฐ˜ํ™˜ํ•œ ๊ฒฐ๊ณผ์˜ ์ˆœ์„œ๋ฅผ ๋” ์ •๊ตํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ์žฌํ‰๊ฐ€ํ•˜์—ฌ ์ตœ์ ํ™”ํ•˜๋Š” 2๋‹จ๊ณ„ ์ž‘์—…์ž…๋‹ˆ๋‹ค [1, 2]. ์ฃผ๋กœ ํ•™์Šต ๊ธฐ๋ฐ˜ ๋žญํ‚น(Learning to Rank, LTR)๊ณผ ๊ฐ™์€ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์ด๋‚˜ ์˜๋ฏธ๋ก ์  ์ ‘๊ทผ๋ฒ•์„ ํ™œ์šฉํ•˜์—ฌ ์ง€์‹ ๊ธฐ๋ฐ˜ ๋‚ด์˜ ์ผ์น˜ ํ•ญ๋ชฉ์— ์ •ํ™•ํ•œ ๊ด€๋ จ์„ฑ ์ ์ˆ˜๋ฅผ ํ• ๋‹นํ•ฉ๋‹ˆ๋‹ค [1, 3, 4]. ํŠนํžˆ ์ตœ๊ทผ์˜ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ํŒŒ์ดํ”„๋ผ์ธ์—์„œ๋Š” ์ดˆ๊ธฐ ๊ฒ€์ƒ‰์œผ๋กœ ์ถ”์ถœ๋œ ์ˆ˜์‹ญ ๊ฐœ์˜ ํ›„๋ณด ์ค‘ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ๋‹ต๋ณ€ ์ƒ์„ฑ์— ๊ฐ€์žฅ ๋„์›€์ด ๋  ์†Œ์ˆ˜์˜ ํ•ต์‹ฌ ๋ฌธ์„œ๋ฅผ ์ •๋ฐ€ํ•˜๊ฒŒ ๊ณจ๋ผ๋‚ด์–ด ํ™˜๊ฐ์„ ์ค„์ด๊ณ  ์‘๋‹ต ํ’ˆ์งˆ์„ ๋†’์ด๋Š” ํ•ต์‹ฌ ์—ญํ• ์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค [5]. ## ๐Ÿ“– Core Content * **2๋‹จ๊ณ„ ๊ฒ€์ƒ‰ ์•„ํ‚คํ…์ฒ˜ (Two-phase scheme):** ์ •๋ณด ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์€ ๋น ๋ฅธ ์‘๋‹ต ์†๋„๋ฅผ ์œ ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ๋‘ ๋‹จ๊ณ„๋กœ ๋‚˜๋‰˜์–ด ์„ค๊ณ„๋ฉ๋‹ˆ๋‹ค. 1๋‹จ๊ณ„์—์„œ๋Š” ๋ฒกํ„ฐ ๊ณต๊ฐ„ ๋ชจ๋ธ์ด๋‚˜ BM25์™€ ๊ฐ™์€ ๋น ๋ฅด๊ณ  ๋‹จ์ˆœํ•œ ๊ฒ€์ƒ‰ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ƒ์œ„ k๊ฐœ์˜ ๊ด€๋ จ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ๋Š” ๋ฌธ์„œ(ํ›„๋ณด๊ตฐ)๋ฅผ ์šฐ์„  ๋„์ถœํ•ฉ๋‹ˆ๋‹ค [2]. 2๋‹จ๊ณ„์ธ ์žฌ์ˆœ์œ„ํ™” ๋‹จ๊ณ„์—์„œ๋Š” ์ •ํ™•๋„๋Š” ๋†’์ง€๋งŒ ์ปดํ“จํŒ… ๋น„์šฉ์ด ๋งŽ์ด ๋“œ๋Š” ๊ธฐ๊ณ„ ํ•™์Šต ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ด ํ›„๋ณด ๋ฌธ์„œ๋“ค์˜ ๊ด€๋ จ์„ฑ ์ ์ˆ˜๋ฅผ ๋‹ค์‹œ ๊ณ„์‚ฐํ•˜๊ณ  ์ˆœ์œ„๋ฅผ ์žฌ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค [2, 6]. * **ํ•™์Šต ๊ธฐ๋ฐ˜ ๋žญํ‚น (Learning to Rank, LTR) ์ ์šฉ:** ์žฌ์ˆœ์œ„ํ™”๋Š” ์ข…์ข… LTR ๊ธฐ์ˆ ์— ํฌ๊ฒŒ ์˜์กดํ•ฉ๋‹ˆ๋‹ค. LTR์€ ์งˆ์˜์™€ ๋ฌธ์„œ์˜ ์Œ์— ๊ด€๋ จ์„ฑ ๋“ฑ๊ธ‰์ด ๋ถ€์—ฌ๋œ 'ํŒ๋‹จ ๋ฆฌ์ŠคํŠธ(Judgment list)'๋ฅผ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค [7]. ์žฌ์ˆœ์œ„ํ™” ํ•จ์ˆ˜๋Š” ์‚ฌ์šฉ์ž์˜ ์งˆ์˜, ๋ฌธ์„œ์˜ ์†์„ฑ, ์งˆ์˜-๋ฌธ์„œ ๊ฐ„์˜ ์ƒํ˜ธ์ž‘์šฉ ํŠน์ง•(์˜ˆ: ์ œ๋ชฉ ํ•„๋“œ์˜ BM25 ์ ์ˆ˜) ๋“ฑ ๋‹ค์–‘ํ•œ ํ”ผ์ฒ˜(Feature)๋ฅผ ์ถ”์ถœํ•˜์—ฌ ๋ฌธ์„œ์˜ ์ตœ์ข… ์ˆœ์œ„๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค [1, 8]. ์‹ค๋ฌด์—์„œ๋Š” LambdaMART์™€ ๊ฐ™์€ ๊ทธ๋ž˜๋””์–ธํŠธ ๋ถ€์ŠคํŒ… ๊ฒฐ์ • ํŠธ๋ฆฌ(GBDT) ๋ชจ๋ธ์ด ๋‚ฎ์€ ์ถ”๋ก  ์ง€์—ฐ ์‹œ๊ฐ„๊ณผ ๊ฐ•๋ ฅํ•œ ๋žญํ‚น ์„ฑ๋Šฅ ๋•๋ถ„์— ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ๋กœ ์ž์ฃผ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค [9, 10]. * **Advanced RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ)์—์„œ์˜ ์žฌ์ˆœ์œ„ํ™”:** ์ตœ์‹ ์˜ ์ง€๋Šฅํ˜• ์ •๋ณด ๊ฒ€์ƒ‰ ๋ฐ ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ AI ์‹œ์Šคํ…œ์—์„œ ์žฌ์ˆœ์œ„ํ™”๋Š” RAG ์„ฑ๋Šฅ์„ ๊ณ ๋„ํ™”ํ•˜๋Š”(Advanced RAG) ํ•„์ˆ˜ ๋‹จ๊ณ„๋กœ ์ž๋ฆฌ ์žก์•˜์Šต๋‹ˆ๋‹ค [5, 11]. ์ดˆ๊ธฐ ๋ฒกํ„ฐ ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ์ˆ˜์‹ญ ๊ฐœ์˜ ํ›„๋ณด ๋ฌธ์„œ๊ฐ€ ๋ฝ‘ํžˆ๋ฉด, ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋“ˆ์ด ์ด ์ค‘ LLM์ด ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ๊ฐ€์žฅ ๋„์›€์ด ๋  3~5๊ฐœ์˜ ๋ฌธ์„œ๋ฅผ ๋‹ค์‹œ ์ •๋ฐ€ํ•˜๊ฒŒ ๊ณจ๋ผ๋ƒ…๋‹ˆ๋‹ค [5]. ์ด๋Š” LLM์˜ ์ œํ•œ๋œ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ๋ฅผ ์ตœ์ ํ™”ํ•˜๊ณ  ๊ฐ€์žฅ ๊ด€๋ จ์„ฑ ๋†’์€ ์ง€์‹๋งŒ์„ ์ฃผ์ž…ํ•จ์œผ๋กœ์จ ํ™˜๊ฐ(Hallucination) ํ˜„์ƒ์„ ํšจ๊ณผ์ ์œผ๋กœ ๋ฐฉ์ง€ํ•ฉ๋‹ˆ๋‹ค [5, 12, 13]. * **๊ฐœ์ธํ™”(Personalization) ์š”์†Œ ํ†ตํ•ฉ:** ์žฌ์ˆœ์œ„ํ™”๋Š” ์ผ๋ฐ˜์ ์ธ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์— ์‚ฌ์šฉ์ž ์†์„ฑ์„ ๋”ํ•ด ๊ฐœ์ธํ™”๋œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•˜๋Š” ๋ฐ์—๋„ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž์˜ ๊ณผ๊ฑฐ ํด๋ฆญ, ์ƒํ˜ธ์ž‘์šฉ ๋“ฑ์˜ ํ–‰๋™ ๋ฐ์ดํ„ฐ(Behavioral tracking data)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์‚ฌ์šฉ์ž ์„ ํ˜ธ๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ํ”ผ์ฒ˜๋ฅผ ์ถ”์ถœํ•˜๊ณ  ์ด๋ฅผ ์žฌ์ˆœ์œ„ํ™” ๊ณผ์ •์— ๋ฐ˜์˜ํ•จ์œผ๋กœ์จ, ๋™์ผํ•œ ๊ฒ€์ƒ‰์–ด๋ผ๋„ ๊ฐœ๋ณ„ ์‚ฌ์šฉ์ž์˜ ์˜๋„๋‚˜ ์ƒํ™ฉ์— ๋งž๋Š” ์ตœ์ ํ™”๋œ ์ˆœ์œ„๋กœ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [14-16]. ## โš–๏ธ Trade-offs & Caveats * **์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค ๋น„์šฉ๊ณผ ์ง€์—ฐ ์‹œ๊ฐ„:** ์žฌ์ˆœ์œ„ํ™”์— ์‚ฌ์šฉ๋˜๋Š” ๊ธฐ๊ณ„ ํ•™์Šต ๋ชจ๋ธ์ด๋‚˜ ์˜๋ฏธ๋ก ์  ํ‰๊ฐ€๋Š” ์ดˆ๊ธฐ ํ‚ค์›Œ๋“œ ๊ฒ€์ƒ‰์— ๋น„ํ•ด ์—ฐ์‚ฐ ๋น„์šฉ์ด ํ›จ์”ฌ ๋งŽ์ด ๋“ญ๋‹ˆ๋‹ค [2, 6]. ์ด๋Ÿฌํ•œ ์ด์œ ๋กœ ์ „์ฒด ๋ฌธ์„œ ์ฝ”ํผ์Šค๊ฐ€ ์•„๋‹Œ, ์ดˆ๊ธฐ ๊ฒ€์ƒ‰์—์„œ ๊ฑธ๋Ÿฌ์ง„ ์†Œ์ˆ˜์˜ ์ƒ์œ„ ๋ฌธ์„œ์—๋งŒ ์žฌ์ˆœ์œ„ํ™”๋ฅผ ์ ์šฉํ•ด์•ผ ํ•˜๋Š” ์„ค๊ณ„์ƒ์˜ ์ œ์•ฝ์ด ๋”ฐ๋ฆ…๋‹ˆ๋‹ค [2]. * **๊ณ ํ’ˆ์งˆ ํŒ๋‹จ ๋ฆฌ์ŠคํŠธ(ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ)์— ๋Œ€ํ•œ ์˜์กด์„ฑ:** LTR ๊ธฐ๋ฐ˜์˜ ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์ด ์ œ๋Œ€๋กœ ์ž‘๋™ํ•˜๋ ค๋ฉด ์งˆ์˜์™€ ๋ฌธ์„œ ๊ฐ„์˜ ๊ด€๋ จ์„ฑ ๋ผ๋ฒจ์ด ํฌํ•จ๋œ ๋ฐฉ๋Œ€ํ•œ ์–‘์˜ 'ํŒ๋‹จ ๋ฆฌ์ŠคํŠธ'๊ฐ€ ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค [7]. ์‚ฌ์šฉ์ž์˜ ํ–‰๋™ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ด๋ฅผ ๊ตฌ์ถ•ํ•  ๋•Œ, ์‚ฌ์šฉ์ž๊ฐ€ ํ•ญ์ƒ ์ƒ์œ„ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ ํด๋ฆญํ•˜๋Š” ๊ฒฝํ–ฅ(์œ„์น˜ ํŽธํ–ฅ, Position bias)๊ณผ ๊ฐ™์€ ํŽธํ–ฅ์ด ๋ฐ์ดํ„ฐ์— ์œ ์ž…๋  ์ˆ˜ ์žˆ์–ด ์ด๋ฅผ ์ •๊ตํ•˜๊ฒŒ ๋ณด์ •ํ•ด์•ผ ํ•˜๋Š” ์–ด๋ ค์›€์ด ์žˆ์Šต๋‹ˆ๋‹ค [16-18]. * **๋ฐ์ดํ„ฐ ๋ถ€์กฑ์œผ๋กœ ์ธํ•œ ์ฝœ๋“œ ์Šคํƒ€ํŠธ(Cold Start) ๋ฌธ์ œ:** ํ–‰๋™ ๊ธฐ๋ฐ˜ ๊ฐœ์ธํ™” ์žฌ์ˆœ์œ„ํ™”๋ฅผ ๊ตฌํ˜„ํ•  ๋•Œ, ์ถฉ๋ถ„ํ•œ ์‚ฌ์šฉ์ž ์ƒํ˜ธ์ž‘์šฉ ๋ฐ์ดํ„ฐ๋‚˜ ์ด๋ ฅ์ด ์ถ•์ ๋˜์ง€ ์•Š์€ ์‹ ๊ทœ ์‚ฌ์šฉ์ž ๋˜๋Š” ์ƒˆ๋กœ์šด ๋ฌธ์„œ์— ๋Œ€ํ•ด์„œ๋Š” ๊ด€๋ จ์„ฑ์„ ์ ์ ˆํžˆ ํ‰๊ฐ€ํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค [18, 19]. * **๊ณผ์ ํ•ฉ(Overfitting) ์œ„ํ—˜:** ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ๋‹ค์–‘ํ•œ ์งˆ์˜ ์œ ํ˜•(์˜ˆ: ์ œ๋ชฉ ๊ฒ€์ƒ‰, ์ €์ž ๊ฒ€์ƒ‰ ๋“ฑ)์— ๋Œ€ํ•œ ๊ธ์ •์ /๋ถ€์ •์  ์˜ˆ์‹œ์˜ ๊ท ํ˜•์„ ๋งž์ถ”์ง€ ์•Š์œผ๋ฉด ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์ด ๊ณผ์ ํ•ฉ๋˜์–ด ์‹ค์ œ ์„œ๋น„์Šค ํ™˜๊ฒฝ์—์„œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์ด ๋–จ์–ด์งˆ ์œ„ํ—˜์ด ์žˆ์Šต๋‹ˆ๋‹ค [20]. ## ๐Ÿ”— Knowledge Connections ### Related Concepts #### [๊ธฐ๋ฐ˜ ๊ธฐ์ˆ  ๋ฐ ์•Œ๊ณ ๋ฆฌ์ฆ˜ (Underlying Technologies & Algorithms)] - [[ํ•™์Šต ๊ธฐ๋ฐ˜ ๋žญํ‚น (Learning to Rank, LTR)]] - ์—ฐ๊ฒฐ ์ด์œ : ์žฌ์ˆœ์œ„ํ™”์˜ ํ•ต์‹ฌ ์—”์ง„์œผ๋กœ ๋จธ์‹ ๋Ÿฌ๋‹์„ ํ™œ์šฉํ•ด ๋ฌธ์„œ์˜ ๊ด€๋ จ์„ฑ ์ ์ˆ˜๋ฅผ ๋งค๊ธฐ๊ณ  ์ˆœ์„œ๋ฅผ ์ตœ์ ํ™”ํ•˜๋Š” ๊ธฐ์ˆ ์  ๊ธฐ๋ฐ˜์ž…๋‹ˆ๋‹ค [1, 4, 9]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์ด ์ ์ˆ˜, ์Œ, ๋ฆฌ์ŠคํŠธ ๋‹จ์œ„(Pointwise, Pairwise, Listwise) ๋“ฑ ์–ด๋–ค ๋ฐฉ์‹์œผ๋กœ ์ˆœ์œ„๋ฅผ ํ‰๊ฐ€ํ•˜๊ณ  ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์ตœ์ ํ™”ํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ์›๋ฆฌ๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [10, 21-23]. - [[์˜๋ฏธ๋ก ์  ๊ฒ€์ƒ‰ (Semantic Search)]] - ์—ฐ๊ฒฐ ์ด์œ : ์žฌ์ˆœ์œ„ํ™” ๋‹จ๊ณ„์—์„œ ๋‹จ์ˆœ ํ‚ค์›Œ๋“œ ๋งค์นญ์„ ๋„˜์–ด ์ง€์‹ ๊ทธ๋ž˜ํ”„์™€ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP)๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ์‚ฌ์šฉ์ž ์˜๋„์— ๋”ฐ๋ผ ์ ์ˆ˜๋ฅผ ํ• ๋‹นํ•˜๋Š” ์›๋ฆฌ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค [3, 24, 25]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: ์ดˆ๊ธฐ ๋ฒกํ„ฐ ๊ฒ€์ƒ‰์ด ๋†“์นœ ๋ฌธ๋งฅ์˜ ๋‰˜์•™์Šค๋‚˜ ์˜๋ฏธ์  ์œ ์‚ฌ์„ฑ์„ ์žฌ์ˆœ์œ„ํ™” ์—”์ง„์ด ์–ด๋–ป๊ฒŒ ํŒŒ์•…ํ•˜์—ฌ ์ตœ์ข… ๋žญํ‚น์— ๋ฐ˜์˜ํ•˜๋Š”์ง€ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [3, 26]. #### [ํ™œ์šฉ ํ™˜๊ฒฝ ๋ฐ ์‹œ์Šคํ…œ ๊ตฌ์กฐ (Application & System Context)] - [[๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ (Advanced RAG)]] - ์—ฐ๊ฒฐ ์ด์œ : ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ํ™˜๊ฒฝ์—์„œ LLM์˜ ํ™˜๊ฐ์„ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ์ˆ˜ํ–‰ํ•˜๋Š” ๊ณ ๋„ํ™”๋œ RAG ํŒŒ์ดํ”„๋ผ์ธ์˜ ํ•„์ˆ˜ ๊ตฌ์„ฑ ์š”์†Œ ์ค‘ ํ•˜๋‚˜๊ฐ€ ์žฌ์ˆœ์œ„ํ™”์ž…๋‹ˆ๋‹ค [5, 12, 27]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: ๋‹ค๋Ÿ‰์˜ ๊ฒ€์ƒ‰๋œ ์ง€์‹ ์กฐ๊ฐ(Chunk)๋“ค ์ค‘์—์„œ ์™œ 3~5๊ฐœ๋งŒ ์„ ๋ณ„ํ•˜์—ฌ ํ”„๋กฌํ”„ํŠธ๋กœ ๊ตฌ์„ฑํ•ด์•ผ ํ•˜๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ํ† ํฐ ์˜ˆ์‚ฐ ๊ด€๋ฆฌ์™€์˜ ๊ด€๊ณ„๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [5, 12]. - [[๊ฐœ์ธํ™” (Personalization)]] - ์—ฐ๊ฒฐ ์ด์œ : ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์— ์‚ฌ์šฉ์ž ๋ฌธ๋งฅ(Context) ๋ฐ ํ–‰๋™ ํ”ผ์ฒ˜๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ, ์งˆ์˜๊ฐ€ ๊ฐ™์•„๋„ ์‚ฌ์šฉ์ž์— ๋”ฐ๋ผ ์ˆœ์œ„๋ฅผ ๋‹ค๋ฅด๊ฒŒ ๋งค๊ธฐ๋Š” ์ฃผ์š” ์ ์šฉ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค [14, 15, 28]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: ๋ฐ์ดํ„ฐ ๋ฐœ๊ฒฌ ๋ฐ ๋น„์ฆˆ๋‹ˆ์Šค ์ธํ…”๋ฆฌ์ „์Šค ํ™˜๊ฒฝ์—์„œ ์‚ฌ์šฉ์ž ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„๊ฐ€ ๊ฒ€์ƒ‰ ๋งŒ์กฑ๋„ ํ–ฅ์ƒ์— ์–ด๋–ป๊ฒŒ ๊ธฐ์—ฌํ•˜๋Š”์ง€ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [28-30]. ### Deeper Research Questions - ์ดˆ๊ธฐ ๊ฒ€์ƒ‰(1๋‹จ๊ณ„)๊ณผ ์žฌ์ˆœ์œ„ํ™”(2๋‹จ๊ณ„) ํŒŒ์ดํ”„๋ผ์ธ์—์„œ ์ตœ์ ์˜ ํ›„๋ณด ๋ฌธ์„œ ์ˆ˜(top-k)๋ฅผ ๊ฒฐ์ •ํ•  ๋•Œ, ์‘๋‹ต ์ง€์—ฐ ์‹œ๊ฐ„(Latency)๊ณผ ์ •ํ™•๋„ ๊ฐ„์˜ ์ƒ์ถฉ ๊ด€๊ณ„๋ฅผ ์–ด๋–ป๊ฒŒ ๋™์ ์œผ๋กœ ์กฐ์œจํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€? - ํ•™์Šต ๊ธฐ๋ฐ˜ ๋žญํ‚น(LTR)์„ ์œ„ํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉ์ž ํด๋ฆญ ๋กœ๊ทธ๋กœ๋ถ€ํ„ฐ ์ž๋™ ์ƒ์„ฑํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์œ„์น˜ ํŽธํ–ฅ(Position Bias)์„ ํšจ๊ณผ์ ์œผ๋กœ ์ œ๊ฑฐํ•˜๋Š” ์ตœ์‹  ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋ฌด์—‡์ธ๊ฐ€? - ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์—์ด์ „ํ‹ฑ RAG(Agentic RAG) ๊ตฌ์กฐ์—์„œ, ๋‹จ์ผ ๋ฌธ์„œ์˜ ๊ด€๋ จ์„ฑ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์—ฌ๋Ÿฌ ๋ฌธ์„œ๊ฐ€ ๊ฒฐํ•ฉ๋˜์—ˆ์„ ๋•Œ์˜ ์‹œ๋„ˆ์ง€์™€ ์ •๋ณด ์ถฉ๋Œ์„ ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์ด ์–ด๋–ป๊ฒŒ ํ‰๊ฐ€ํ•˜๋Š”๊ฐ€? - ์˜คํ”„๋ผ์ธ ํ™˜๊ฒฝ์ด๋‚˜ ๋ฐ์ดํ„ฐ ํ”„๋ผ์ด๋ฒ„์‹œ๊ฐ€ ์—„๊ฒฉํ•œ ์‚ฐ์—…๊ตฐ์—์„œ ์™ธ๋ถ€ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋‚˜ ๊ฑฐ๋Œ€ LLM ์—†์ด ๋กœ์ปฌ์— ์ตœ์ ํ™”๋œ ์˜๋ฏธ๋ก ์  ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์„ ๊ฒฝ๋Ÿ‰ํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋ฌด์—‡์ธ๊ฐ€? - ํ–‰๋™ ๋ฐ์ดํ„ฐ๊ฐ€ ์ „ํ˜€ ์—†๋Š” ์ฝœ๋“œ ์Šคํƒ€ํŠธ(Cold Start) ์ƒํ™ฉ์˜ ์‹ ๊ทœ ๋ฌธ์„œ๋ฅผ ์žฌ์ˆœ์œ„ํ™” ๋žญํ‚น ์ƒ๋‹จ์— ๋…ธ์ถœ์‹œํ‚ค๊ธฐ ์œ„ํ•œ ํƒ์ƒ‰-ํ™œ์šฉ(Exploration-Exploitation) ์ „๋žต์€ ์–ด๋–ป๊ฒŒ ๊ตฌํ˜„๋˜๋Š”๊ฐ€? ### Practical Application Contexts - **Implementation:** Advanced RAG ์•„ํ‚คํ…์ฒ˜๋ฅผ ๋„์ž…ํ•  ๋•Œ, ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค(์˜ˆ: Pinecone, Weaviate ๋“ฑ)์—์„œ ์ˆ˜ํ–‰๋œ ์ดˆ๊ธฐ ์˜๋ฏธ๋ก ์  ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ์ˆ˜์‹ญ ๊ฐœ๋ฅผ ๋ฐ›์•„, ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์— ๊ฐ€์žฅ ์ง์ ‘์ ์ธ ๊ทผ๊ฑฐ๊ฐ€ ๋  3~5๊ฐœ์˜ ํ•ต์‹ฌ ํ…์ŠคํŠธ ์กฐ๊ฐ(Chunk)๋งŒ์„ ์ตœ์ข… ์„ ๋ณ„ํ•˜๋Š” ๋ชจ๋“ˆ๋กœ ์žฌ์ˆœ์œ„ํ™” ๋กœ์ง์„ ์ฝ”๋“œ๋กœ ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค [5, 12, 31]. - **System Design:** ์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค์˜ ๋ณ‘๋ชฉ์„ ๋ง‰๊ธฐ ์œ„ํ•ด ๊ฒ€์ƒ‰ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋ถ„๋ฆฌํ•˜์—ฌ ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค. ์ˆ˜์–ต ๊ฑด์˜ ๋ฌธ์„œ๋Š” ๋น ๋ฅธ ์—ญ์ƒ‰์ธ์ด๋‚˜ ๊ทผ์‚ฌ ์ตœ๊ทผ์ ‘ ์ด์›ƒ(ANN) ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ์กฐํšŒํ•˜๊ณ , ๊ทธ์ค‘ ์ถ”์ถœ๋œ 100์—ฌ ๊ฑด ์ดํ•˜์˜ ํ›„๋ณด๊ตฐ์— ๋Œ€ํ•ด์„œ๋งŒ LambdaMART๋‚˜ ๊ต์ฐจ ์ธ์ฝ”๋”(Cross-encoder)์™€ ๊ฐ™์€ ๋ฌด๊ฑฐ์šด ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํƒœ์›Œ ์ˆœ์œ„๋ฅผ ๋ฐ”๊พธ๋Š” 'Two-phase' ์‹œ์Šคํ…œ์„ ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค [2, 6, 9]. - **Operation / Maintenance:** ์šด์˜ ํ™˜๊ฒฝ์—์„œ ์‚ฌ์šฉ์ž ํ–‰๋™(ํด๋ฆญ, ์ฒด๋ฅ˜ ์‹œ๊ฐ„, ๊ฒ€์ƒ‰์–ด ์ˆ˜์ • ๋“ฑ) ๋ฐ A/B ํ…Œ์ŠคํŠธ ์ง€ํ‘œ๋ฅผ ์ง€์†์ ์œผ๋กœ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜์—ฌ ํŒ๋‹จ ๋ฆฌ์ŠคํŠธ๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๊ณ , MLOps ํŒŒ์ดํ”„๋ผ์ธ์„ ํ†ตํ•ด ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์„ ์žฌํ•™์Šต์‹œํ‚ค๋ฉฐ ๋ชจ๋ธ์˜ ์ •ํ™•์„ฑ ํ•˜๋ฝ(Drift)์„ ๋ฐฉ์ง€ํ•ฉ๋‹ˆ๋‹ค [4, 18, 28, 32]. - **Learning Path:** ์ „ํ†ต์ ์ธ ํ‚ค์›Œ๋“œ ๊ฒ€์ƒ‰ ์›๋ฆฌ(TF-IDF, BM25)๋ฅผ ํ•™์Šตํ•œ ํ›„, ๋ฒกํ„ฐ ์ž„๋ฒ ๋”ฉ์„ ์ด์šฉํ•œ ์˜๋ฏธ๋ก ์  ๊ฒ€์ƒ‰์œผ๋กœ ๋„˜์–ด๊ฐ€๋ฉฐ, ์ตœ์ข…์ ์œผ๋กœ๋Š” ๊ฒ€์ƒ‰ ํ’ˆ์งˆ์„ ๊ทน๋Œ€ํ™”ํ•˜๊ธฐ ์œ„ํ•ด LTR(๊ธฐ๊ณ„ ํ•™์Šต ๋žญํ‚น) ๋ชจ๋ธ ํ›ˆ๋ จ๊ณผ RAG ๋‚ด์—์„œ์˜ ์žฌ์ˆœ์œ„ํ™” ๊ธฐ๋ฒ•์„ ์Šต๋“ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์‹ฌํ™” ํ•™์Šต์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. - **My Project Relevance:** ์‚ฌ๋‚ด ์ง€์‹ ๊ธฐ๋ฐ˜ ์ฑ—๋ด‡์ด๋‚˜ ์ „์ž์ƒ๊ฑฐ๋ž˜ ๋งž์ถคํ˜• ์ถ”์ฒœ ์‹œ์Šคํ…œ ๊ธฐํš ์‹œ, ๋‹จ์ˆœ ํ‚ค์›Œ๋“œ ๊ฒ€์ƒ‰์˜ ๋ถ€์ •ํ™•์„ฑ(์ˆ˜๋งŽ์€ ๋…ธ์ด์ฆˆ ๋ฌธ์„œ ํฌํ•จ)์„ ํ•ด๊ฒฐํ•˜๊ณ  ๋น„์ฆˆ๋‹ˆ์Šค ์ˆ˜์ต(AOV ๋“ฑ) ๋ฐ ์‚ฌ์šฉ์ž์˜ ์˜๋„ ์ถฉ์กฑ๋ฅ ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ํ•ต์‹ฌ์ ์œผ๋กœ ๊ณ ๋ คํ•ด์•ผ ํ•  ์•„ํ‚คํ…์ฒ˜ ์ „๋žต์ž…๋‹ˆ๋‹ค [13, 33, 34]. ### Adjacent Topics - [[์ง€์‹ ๊ทธ๋ž˜ํ”„ (Knowledge Graph)]] - ํ™•์žฅ ๋ฐฉํ–ฅ: ์žฌ์ˆœ์œ„ํ™” ์‹œ ๋‹จ์ˆœ ํ…์ŠคํŠธ ์œ ์‚ฌ๋„๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์—”ํ‹ฐํ‹ฐ ๊ฐ„์˜ ๋ช…์‹œ์ ์ธ ์ƒํ˜ธ ๊ด€๊ณ„(Relationship) ๋ฐ์ดํ„ฐ๋ฅผ ๋žญํ‚น ์ ์ˆ˜์— ๊ฒฐํ•ฉํ•˜์—ฌ ๋‹ค๋‹จ๊ณ„ ๊ฒ€์ƒ‰(Multi-hop search) ๋ฐ ์ถ”๋ก  ์ •ํ™•๋„๋ฅผ ๊ทน๋Œ€ํ™”ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. - [[์ •๋ณด ๊ฒ€์ƒ‰ ํ‰๊ฐ€ ์ง€ํ‘œ (Information Retrieval Evaluation Metrics)]] - ํ™•์žฅ ๋ฐฉํ–ฅ: ์žฌ์ˆœ์œ„ํ™” ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ์†์‹ค ํ•จ์ˆ˜์™€ ์ง์ ‘์ ์œผ๋กœ ์—ฐ๊ด€๋œ nDCG, MAP, MRR, ERR ๋“ฑ์˜ ์˜คํ”„๋ผ์ธ ํ‰๊ฐ€ ์ง€ํ‘œ์— ๋Œ€ํ•ด ๊นŠ์ด ์žˆ๊ฒŒ ์กฐ์‚ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. --- *Last updated: 2026-05-04*