--- category: Core Hub tags: [auto-wikified, p-reinforce-v3] title: Miscellaneous AI Topics last_updated: 2026-05-04 --- # Miscellaneous AI Topics This document is a consolidated knowledge hub following the P-Reinforce v3.0 standard. ## [[ETL Pipeline]] ### ๐Ÿ“Œ Brief Summary ETL(Extract, Transform, Load) ํŒŒ์ดํ”„๋ผ์ธ์€ RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ) ์‹œ์Šคํ…œ์˜ ํšจ์œจ์„ฑ๊ณผ ์„ฑํŒจ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ํ•ต์‹ฌ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ํŒŒ์ดํ”„๋ผ์ธ์ž…๋‹ˆ๋‹ค [1, 2]. ์ด ํŒŒ์ดํ”„๋ผ์ธ์€ ์‚ฌ๋žŒ์ด ์‚ฌ์šฉํ•˜๋Š” ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๊ณ„๊ฐ€ ์˜๋ฏธ๋ก ์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜๊ณ  ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ํ˜•์‹์œผ๋กœ ์ •์ œํ•˜๊ณ  ๋ณ€ํ™˜ํ•˜๋Š” ์—ญํ• ์„ ๋‹ด๋‹นํ•ฉ๋‹ˆ๋‹ค [1]. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์›๋ณธ ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”์ถœ ๋ฐ ํ‘œ์ค€ํ™”ํ•˜๊ณ , ์ ์ ˆํ•œ ํฌ๊ธฐ๋กœ ๋ถ„ํ• ํ•œ ๋’ค, ๋ฒกํ„ฐ ํ˜•ํƒœ๋กœ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ €์žฅํ•˜๋Š” ์ „์ฒด ๊ณผ์ •์„ ํฌ๊ด„ํ•ฉ๋‹ˆ๋‹ค [2]. ### ๐Ÿ“– Core Content RAG ์‹œ์Šคํ…œ ๋‚ด์—์„œ ETL ํŒŒ์ดํ”„๋ผ์ธ์€ ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค: * **์ถ”์ถœ (Extract - ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ๋กœ๋“œ):** ํŒŒ์ดํ”„๋ผ์ธ์˜ ์ฒซ ๋ฒˆ์งธ ๋‹จ๊ณ„๋Š” ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฌธ์„œ๋ฅผ ์†Œ์‹ฑํ•˜๊ณ  ๊ฐ€์ ธ์˜ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค [1]. 2026๋…„ ๊ธฐ์ค€์œผ๋กœ๋Š” PDF, Markdown ํŒŒ์ผ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ํ…Œ์ด๋ธ”, ์ด๋ฏธ์ง€, ์˜ค๋””์˜ค ํŠธ๋žœ์Šคํฌ๋ฆฝํŠธ ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•์‹์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค [1]. ์ดํ›„ ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ž„๋ฒ ๋”ฉํ•˜๊ธฐ ์ „์— ๋ชจ๋“  ๋ฌธ์„œ๋ฅผ ์‹œ์Šคํ…œ์ด ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ํ‘œ์ค€ํ™”๋œ ํ…์ŠคํŠธ ํŒŒ์ผ(ํ‘œํ˜„)๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ •๋ฆฌํ•ฉ๋‹ˆ๋‹ค [1, 2]. * **๋ณ€ํ™˜ (Transform - ์ฒญํ‚น):** ๋ณ€ํ™˜ ๋‹จ๊ณ„์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์•„ํ‚คํ…์ฒ˜์  ๊ฒฐ์ •์€ '์ฒญํ‚น(Chunking)'์ž…๋‹ˆ๋‹ค [3]. ์ฒญํ‚น์€ ์ถ”์ถœ๋œ ๋ฌธ์„œ๋ฅผ ๊ฒ€์ƒ‰ ๋ฐ ๋ชจ๋ธ ์ฒ˜๋ฆฌ์— ์ ํ•ฉํ•˜๋„๋ก ์ž‘๊ณ  ๊ด€๋ฆฌ ๊ฐ€๋Šฅํ•œ ์กฐ๊ฐ(์ฒญํฌ)์œผ๋กœ ๋ถ„ํ• ํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค [2, 3]. ์˜๋ฏธ, ๋ฌธ์žฅ, ํ† ํฐ, ํฌ๋งทํŒ…, HTML ๋ฌธ์ž ๋“ฑ ๊ณ ์œ ํ•œ ํŠน์„ฑ์„ ๊ธฐ์ค€์œผ๋กœ ๋ฌธ์„œ๋ฅผ ํŒŒ์‹ฑํ•˜๊ณ  ์นดํƒˆ๋กœ๊ทธํ™”ํ•˜์—ฌ ๊ฒ€์ƒ‰์„ ์ค€๋น„ํ•ฉ๋‹ˆ๋‹ค [2]. * **์ ์žฌ (Load - ์ž„๋ฒ ๋”ฉ ๋ฐ ์ €์žฅ):** ๋ถ„ํ• ๋œ ํ…์ŠคํŠธ ์ฒญํฌ๋Š” ํŠนํ™”๋œ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ(๋ฒกํ„ฐ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ)์„ ๊ฑฐ์ณ ๊ณ ์ฐจ์›์˜ ์ˆ˜์น˜ ๋ฒกํ„ฐ(numerical vectors)๋กœ ๋ณ€ํ™˜๋ฉ๋‹ˆ๋‹ค [2, 4]. ์ด๋ ‡๊ฒŒ ํ…์ŠคํŠธ์˜ ํ•ต์‹ฌ ์˜๋ฏธ๋ฅผ ๋‹ด์€ ๋ฒกํ„ฐ๊ฐ’๋“ค์€ ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์ธ๋ฑ์‹ฑ ๋ฐ ์ €์žฅ๋˜๋ฉฐ, ์ดํ›„ ์‚ฌ์šฉ์ž์˜ ์ฟผ๋ฆฌ๊ฐ€ ๋“ค์–ด์™”์„ ๋•Œ ์ˆ˜ํ•™์  ์œ ์‚ฌ๋„ ๊ฒ€์ƒ‰์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์‹œ์Šคํ…œ์˜ '๋ฉ”๋ชจ๋ฆฌ' ์—ญํ• ์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค [2, 4]. ### โš–๏ธ Trade-offs & Caveats ETL ํŒŒ์ดํ”„๋ผ์ธ์˜ '๋ณ€ํ™˜(Transform)' ๋‹จ๊ณ„์—์„œ ์ˆ˜ํ–‰๋˜๋Š” ์ฒญํ‚น(Chunking) ๊ณผ์ •์€ ๋งค์šฐ ๊นŒ๋‹ค๋กœ์šด ๊ท ํ˜• ์žก๊ธฐ(delicate balancing act)๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค [3]. * **์ฒญํฌ ํฌ๊ธฐ ์ดˆ๊ณผ์˜ ๋ถ€์ž‘์šฉ:** ํ…์ŠคํŠธ ์ฒญํฌ๋ฅผ ๋„ˆ๋ฌด ํฌ๊ฒŒ ์„ค์ •ํ•˜๋ฉด LLM์ด ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ(Context window) ์šฉ๋Ÿ‰์„ ์ดˆ๊ณผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [3, 5]. ๋˜ํ•œ, ์งˆ๋ฌธ๊ณผ ๊ด€๋ จ ์—†๋Š” '๋…ธ์ด์ฆˆ(noise)' ๋ฐ์ดํ„ฐ๊นŒ์ง€ ํฌํ•จ๋  ํ™•๋ฅ ์ด ๋†’์•„์ ธ ์˜คํžˆ๋ ค AI ๋ชจ๋ธ์„ ํ˜ผ๋ž€์Šค๋Ÿฝ๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [3]. * **์ฒญํฌ ์„ธ๋ถ„ํ™”์˜ ์ œ์•ฝ ์‚ฌํ•ญ:** ๋ฐ˜๋Œ€๋กœ ์ฒญํฌ๋ฅผ ๋„ˆ๋ฌด ์ž‘๊ฒŒ ๋ถ„ํ• ํ•˜๋ฉด ํ…์ŠคํŠธ์˜ ์ฃผ๋ณ€ ๋ฌธ๋งฅ์ด ๋ฒ—๊ฒจ์ง€๋ฉด์„œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ณธ๋ž˜ ์ง€๋‹ˆ๊ณ  ์žˆ๋˜ ์˜๋ฏธ์  ์ผ๊ด€์„ฑ(semantic coherency)์„ ์žƒ๊ฒŒ ๋  ์œ„ํ—˜์ด ์žˆ์Šต๋‹ˆ๋‹ค [3, 5]. * **์ตœ์ ํ™” ๋ฐฉ๋ฒ•:** ์ด๋Ÿฌํ•œ ๋ถ€์ž‘์šฉ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด 2026๋…„์˜ ๊ณ ๊ธ‰ RAG ์‹œ์Šคํ…œ๋“ค์€ ์„น์…˜ ํ—ค๋”๋‚˜ ์ฃผ์ œ ์ „ํ™˜๊ณผ ๊ฐ™์ด ํ…์ŠคํŠธ์˜ ๋…ผ๋ฆฌ์  ๋‹จ์ ˆ์„ ์‹๋ณ„ํ•˜๋Š” '์ œ๋ชฉ ์ธ์ง€(heading-aware)' ์ฒญํ‚น์ด๋‚˜ '์˜๋ฏธ๋ก ์  ์ฒญํ‚น(semantic chunking)' ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ์˜ ๋ฌด๊ฒฐ์„ฑ์„ ์œ ์ง€ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค [3]. --- *Last updated: 2026-05-04* --- ## [[External Memory Augmentation]] ### ๐Ÿ“Œ Brief Summary External Memory Augmentation(์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ ์ฆ๊ฐ•)์€ AI ๋ชจ๋ธ์˜ ์ œํ•œ๋œ ์ปจํ…์ŠคํŠธ ์ฐฝ ์™ธ๋ถ€์— ๋Œ€ํ™” ๊ธฐ๋ก, ๋ฌธ์„œ ๋ฐ ์ง€์‹ ๊ธฐ๋ฐ˜ ์ฝ˜ํ…์ธ ๋ฅผ ์ €์žฅํ•ด๋‘๊ณ , ํ•„์š”ํ•  ๋•Œ๋งˆ๋‹ค ๊ด€๋ จ์„ฑ์ด ๋†’์€ ์ •๋ณด์˜ ํ•˜์œ„ ์ง‘ํ•ฉ์„ ๋™์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋ชจ๋ธ์— ์ œ๊ณตํ•˜๋Š” ์•„ํ‚คํ…์ฒ˜ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค [1, 2]. ์ด ํŒจํ„ด์€ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG) ํ”„๋ ˆ์ž„์›Œํฌ์™€ ํšจ๊ณผ์ ์œผ๋กœ ๊ฒฐํ•ฉํ•˜์—ฌ, ๋ฌดํ•œํžˆ ๊ธธ์–ด์งˆ ์ˆ˜ ์žˆ๋Š” ๋Œ€ํ™”๋‚˜ ๋Œ€๊ทœ๋ชจ ์ง€์‹ ๊ธฐ๋ฐ˜์„ ๋น„์šฉ ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค [2]. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ •์ ์ด์—ˆ๋˜ ์ œ2์˜ ๋‡Œ(Second Brain)๋ฅผ ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ์ถœ์ฒ˜์— ๊ธฐ๋ฐ˜์„ ๋‘” '์ฆ๊ฐ• ์ถ”๋ก (Augmented reasoning)' ์‹œ์Šคํ…œ์œผ๋กœ ์ง„ํ™”์‹œํ‚ต๋‹ˆ๋‹ค [3]. ### ๐Ÿ“– Core Content * **์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ์˜ ์—ญํ• ๊ณผ RAG ํ†ตํ•ฉ**: ์ตœ์‹  ์–ธ์–ด ๋ชจ๋ธ์€ ์ตœ๋Œ€ 20๋งŒ ํ† ํฐ ์ด์ƒ์˜ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ์ œ๊ณตํ•˜์ง€๋งŒ, ์ •๋ณด๊ฐ€ ๋ˆ„์ ๋ ์ˆ˜๋ก ์ œํ•œ๋œ ์šฉ๋Ÿ‰์€ ์ดˆ๊ณผ๋  ์ˆ˜๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค [4, 5]. ์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ ์•„ํ‚คํ…์ฒ˜๋Š” ์ „์ฒด ๋Œ€ํ™”๋ฅผ ์ปจํ…์ŠคํŠธ์— ๋งž์ถ”๋ ค ํ•˜๋Š” ๋Œ€์‹ , ๋Œ€ํ™” ๊ธฐ๋ก ๋ฐ ๋ฌธ์„œ ๋“ฑ์„ ์™ธ๋ถ€ ์ €์žฅ์†Œ์— ๋ณด๊ด€ํ•ฉ๋‹ˆ๋‹ค [1, 2]. ๊ฐ ๋ชจ๋ธ ํ˜ธ์ถœ ์‹œ, RAG๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์™ธ๋ถ€ ์ €์žฅ์†Œ(์ œ2์˜ ๋‡Œ)์—์„œ ๊ฐ€์žฅ ๊ด€๋ จ๋œ ํ…์ŠคํŠธ ์กฐ๊ฐ์ด๋‚˜ ์ง€์‹์„ ๊ฒ€์ƒ‰ํ•ด ํ”„๋กฌํ”„ํŠธ์— ํฌํ•จ์‹œํ‚ค๋Š” ๋ฐฉ์‹์œผ๋กœ ์ปจํ…์ŠคํŠธ ํ•œ๊ณ„๋ฅผ ์šฐ์›”ํ•˜๊ฒŒ ๊ทน๋ณตํ•ฉ๋‹ˆ๋‹ค [2, 6]. * **ํ† ํฐ ์˜ˆ์‚ฐ ๊ด€๋ฆฌ ๋ฐ ๋น„์šฉ ์ตœ์ ํ™”**: ๋งŽ์€ ์ •๋ณด๋ฅผ ๋‹จ์ผ ์ปจํ…์ŠคํŠธ ์ฐฝ์œผ๋กœ ๋ชจ๋‘ ๋ณด๋‚ด๋Š” ์ „์ฒด ์ปจํ…์ŠคํŠธ ์ ‘๊ทผ ๋ฐฉ์‹์€ ์ถ”๋ก  ์‹œ ์—ฐ์‚ฐ ๋น„์šฉ์ด ๋งค์šฐ ๋งŽ์ด ๋“ญ๋‹ˆ๋‹ค [7]. ๊ธด ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ์ง€์›ํ•˜๋Š” ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค, ์‚ฌ์‹ค ๊ธฐ๋ฐ˜์˜ ์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ์„ ๋ณ„์ ์œผ๋กœ ์ฃผ์ž…ํ•˜๋Š” ๊ฒƒ์ด ์ง€์†์ ์ธ ์—์ด์ „ํŠธ ์ž‘์—… ๋ถ€ํ•˜์—์„œ ํ›จ์”ฌ ์ ์€ ๋น„์šฉ์œผ๋กœ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์ •ํ™•๋„๋ฅผ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค [8, 9]. * **ํšจ๊ณผ์ ์ธ ๊ฒ€์ƒ‰ ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ๋„์ž…**: ์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋ฒกํ„ฐ ์œ ์‚ฌ๋„ ๊ฒ€์ƒ‰(Vector similarity search)๊ณผ ๊ฐ™์€ ๊ฒ€์ƒ‰ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค [2]. ์ด ๋ฉ”์ปค๋‹ˆ์ฆ˜์€ ๊ด€๋ จ๋œ ์ •๋ณด๋ฅผ ์‹๋ณ„ํ•˜์ง€๋งŒ, ์˜๋ฏธ๋ก ์  ์œ ์‚ฌ๋„ ์ ์ˆ˜๊ฐ€ ๊ฐ€์žฅ ๋†’๊ฒŒ ๋‚˜ํƒ€๋‚˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ๋ผ๋„ ์—์ด์ „ํŠธ ์ž‘์—…์— ์ค‘์š”ํ•œ ์ปจํ…์ŠคํŠธ๋ผ๋ฉด ๋ฐ˜๋“œ์‹œ ํฌํ•จ๋˜๋„๋ก ๋ณด์žฅํ•˜๋Š” ์ถ”๊ฐ€์ ์ธ ๋…ผ๋ฆฌ๊ฐ€ ์‹œ์Šคํ…œ์— ์š”๊ตฌ๋  ๋•Œ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค [2]. * **๊ฐœ์ธ ์ง€์‹ ๊ด€๋ฆฌ(PKM)์˜ ๋Šฅ๋™์  ์ง„ํ™”**: ์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ์™€ RAG์˜ ๊ฒฐํ•ฉ์€ ์˜ต์‹œ๋””์–ธ(Obsidian), ๋กœ๊ทธ์‹œํฌ(Logseq), ๋…ธ์…˜(Notion)๊ณผ ๊ฐ™์€ ์ •๋ณด ์•„ํ‚คํ…์ฒ˜์— ๊ทผ๋ณธ์ ์ธ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ ธ์™”์Šต๋‹ˆ๋‹ค [3, 10]. ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ์€ ๋‹จ์ˆœํžˆ ์ •๋ณด๊ฐ€ ์ €์žฅ๋˜๊ณ  ์žŠํžˆ๋Š” ๊ณต๊ฐ„์„ ๋„˜์–ด, ๋กœ์ปฌ ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ ์ง€์‹ ๊ทธ๋ž˜ํ”„๋ฅผ ํ™œ์šฉํ•ด ์•„์ด๋””์–ด ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ์ถ”๋ก ํ•˜๊ณ  ์‚ฌ์šฉ์ž์—๊ฒŒ ๋Šฅ๋™์ ์œผ๋กœ ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ•˜๋Š” ์ž์œจ์ ์ธ ๋””์ง€ํ„ธ ํŒŒํŠธ๋„ˆ๋กœ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค [11, 12]. ### โš–๏ธ Trade-offs & Caveats * **๊ฒ€์ƒ‰ ํ’ˆ์งˆ์— ๋Œ€ํ•œ ์ „์ ์ธ ์˜์กด**: ์‹œ์Šคํ…œ์ด ์˜ฌ๋ฐ”๋ฅธ ๋ฌธ๋งฅ์„ ์‹๋ณ„ํ•˜์ง€ ๋ชปํ•˜๋ฉด ์˜ค๋ฅ˜๊ฐ€ ์—ฐ์‡„์ ์œผ๋กœ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค [13]. ์ž„๋ฒ ๋”ฉ ํ’ˆ์งˆ์ด ๋–จ์–ด์ง€๋ฉด ๋ถ€์‹คํ•œ ๊ฒ€์ƒ‰์œผ๋กœ ์ด์–ด์ง€๊ณ , ์ด๋Š” ๊ฒฐ๊ตญ ๊ทผ๊ฑฐ๊ฐ€ ๋ถ€์กฑํ•˜๊ฑฐ๋‚˜ ๋ถ€์ •ํ™•ํ•œ ๋ชจ๋ธ ์ƒ์„ฑ ๊ฒฐ๊ณผ(ํ• ๋ฃจ์‹œ๋„ค์ด์…˜)๋ฅผ ์œ ๋ฐœํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค [13]. * **์ฒญํ‚น(Chunking) ์ตœ์ ํ™”์˜ ์–ด๋ ค์›€**: ๋ฐฉ๋Œ€ํ•œ ์–‘์˜ ๋ฌธ์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ๋กœ ํ™œ์šฉํ•˜๋ ค๋ฉด ๋ฐ์ดํ„ฐ๋ฅผ ๊ด€๋ฆฌ ๊ฐ€๋Šฅํ•œ ํฌ๊ธฐ์˜ ์กฐ๊ฐ(์ฒญํฌ)์œผ๋กœ ๋‚˜๋ˆ„์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค [14]. ์ฒญํฌ๊ฐ€ ๋„ˆ๋ฌด ํฌ๋ฉด ๋ชจ๋ธ์˜ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ์ดˆ๊ณผํ•˜๊ฑฐ๋‚˜ ๋ฌด๊ด€ํ•œ ๋…ธ์ด์ฆˆ๊ฐ€ ์„ž์—ฌ ๋ชจ๋ธ์„ ํ˜ผ๋ž€์Šค๋Ÿฝ๊ฒŒ ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋„ˆ๋ฌด ์ž‘์œผ๋ฉด ์ฃผ๋ณ€ ๋ฌธ๋งฅ์ด ์ œ๊ฑฐ๋˜๋ฉด์„œ ์˜๋ฏธ์  ์ผ๊ด€์„ฑ์„ ์žƒ๊ฒŒ ๋˜๋Š” ๋“ฑ ์„ธ๋ฐ€ํ•œ ๊ท ํ˜•์„ ๋งž์ถ”์–ด์•ผ ํ•˜๋Š” ์ œ์•ฝ์ด ์žˆ์Šต๋‹ˆ๋‹ค [14, 15]. * **ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜ RAG์˜ ๋ณด์•ˆ ๋ฐ ๋ฒค๋” ์ข…์†์„ฑ**: ์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ด€๋ฆฌํ˜• ํด๋ผ์šฐ๋“œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์˜์กดํ•  ๊ฒฝ์šฐ, ์ œ๊ณต ์—…์ฒด์˜ ๋ณด์•ˆ ์กฐ์น˜ ๋ฐ ์„œ๋น„์Šค ์•ฝ๊ด€์— ์ข…์†๋ฉ๋‹ˆ๋‹ค [16]. ํด๋ผ์šฐ๋“œ ํ™˜๊ฒฝ์—์„œ๋Š” ํ”„๋กฌํ”„ํŠธ๋‚˜ ๋ฉ”ํƒ€๋ฐ์ดํ„ฐ๊ฐ€ ๋„คํŠธ์›Œํฌ๋กœ ์ „์†ก๋˜๋ฏ€๋กœ, ์˜๋„์น˜ ์•Š์€ ๋ฐ์ดํ„ฐ ์œ ์ถœ์ด๋‚˜ ํ•ดํ‚น ๋“ฑ ๋„คํŠธ์›Œํฌ ๋…ธ์ถœ ์œ„ํ—˜์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [16, 17]. * **๋กœ์ปฌ ์ธํ”„๋ผ์˜ ๋ณต์žก์„ฑ๊ณผ ์„ฑ๋Šฅ ์ œ์•ฝ**: ํ”„๋ผ์ด๋ฒ„์‹œ ํ™•๋ณด๋ฅผ ์œ„ํ•ด ๋ชจ๋“  ์ž„๋ฒ ๋”ฉ, ๋ฐ์ดํ„ฐ ์ €์žฅ, ์ถ”๋ก ์„ ๋กœ์ปฌ ๋จธ์‹ ์—์„œ ์ฒ˜๋ฆฌ(๋กœ์ปฌ RAG)ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ์ด๋Š” ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ์— ์ง์ ‘์ ์œผ๋กœ ๋ถ€๋”ชํž™๋‹ˆ๋‹ค [18, 19]. ํด๋ผ์šฐ๋“œ API๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ 1์ดˆ ๋ฏธ๋งŒ์œผ๋กœ ๋๋‚  ์ž‘์—…์ด ๋กœ์ปฌ์˜ ์ค‘๊ฐ„๊ธ‰ ํ•˜๋“œ์›จ์–ด์—์„œ๋Š” ํ›จ์”ฌ ๊ธด ์ง€์—ฐ ์‹œ๊ฐ„์„ ๋ฐœ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ง€์†์ ์ธ ์œ ์ง€ ๊ด€๋ฆฌ์™€ ๊ธฐ์ˆ ์  ์„ค์ •์ด๋ผ๋Š” ์šด์˜ ์ƒ์˜ ๋ถ€๋‹ด์ด ๋’ค๋”ฐ๋ฆ…๋‹ˆ๋‹ค [16, 19]. --- *Last updated: 2026-05-04* --- ## [[Re-ranking]] ### ๐Ÿ“Œ Brief Summary Re-ranking(์žฌ์ •๋ ฌ)์€ RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ) ์‹œ์Šคํ…œ์—์„œ ์ดˆ๊ธฐ ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ๋ฐ˜ํ™˜๋œ ๊ฒฐ๊ณผ๋“ค์˜ ์ˆœ์„œ๋ฅผ ๊ฐ€์žฅ ๊ด€๋ จ์„ฑ์ด ๋†’์€ ํ•ญ๋ชฉ์ด ์ƒ์œ„์— ์˜ค๋„๋ก ๋‹ค์‹œ ์ •๋ ฌํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค [1]. ์˜๋ฏธ๋ก ์  ๊ฒ€์ƒ‰์ด๋‚˜ ํ‚ค์›Œ๋“œ ๊ฒ€์ƒ‰์„ ๋ณ‘ํ–‰ํ•œ ๋’ค ์ตœ์ข…์ ์œผ๋กœ LLM(๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์— ์ „๋‹ฌํ•  ์ปจํ…์ŠคํŠธ๋ฅผ ์„ ๋ณ„ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์˜ ์ •ํ™•๋„์™€ ํ’ˆ์งˆ์„ ๋†’์ž…๋‹ˆ๋‹ค [2, 3]. ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋‹จ์ˆœ ๊ฒ€์ƒ‰์ด ์ œ๊ณตํ•˜๋Š” '์žฌํ˜„์œจ(Recall)'์˜ ํ•œ๊ณ„๋ฅผ ๋„˜์–ด ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋†’์€ '์ ํ•ฉ์„ฑ(Relevance)'์„ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ํ•ต์‹ฌ ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค [4]. ### ๐Ÿ“– Core Content * **2๋‹จ๊ณ„ ์ ‘๊ทผ๋ฒ• (Two-stage approach):** ํ”„๋กœ๋•์…˜ RAG ํŒŒ์ดํ”„๋ผ์ธ์—์„œ๋Š” ๋น„์šฉ๊ณผ ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์ž‘์€ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ๋กœ 1์ฐจ ๊ฒ€์ƒ‰(Initial retrieval pass)์„ ์ˆ˜ํ–‰ํ•œ ๋’ค, ์ตœ์ข… ๊ฒฐ๊ณผ ์ง‘ํ•ฉ์— ๋Œ€ํ•ด ๋” ํฐ ๋ชจ๋ธ์ด๋‚˜ ์ „์šฉ Re-ranker๋ฅผ ์ ์šฉํ•˜๋Š” 2๋‹จ๊ณ„ ๋ฐฉ์‹์„ ์ฃผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค [5]. LLM API ๋น„์šฉ์„ ์ค„์ด๋ฉด์„œ๋„ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋ ค๋ฉด ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์ž์ฒด๋ฅผ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ์ด๋Ÿฌํ•œ 2๋‹จ๊ณ„ ์ ‘๊ทผ์ด ํ•ฉ๋ฆฌ์ ์ธ ์„ ํƒ์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [5]. * **ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๊ฒ€์ƒ‰๊ณผ์˜ ๊ฒฐํ•ฉ:** ์ตœ์‹  RAG ์•„ํ‚คํ…์ฒ˜๋Š” ๋ฐ€์ง‘ ๊ฒ€์ƒ‰(Dense retrieval)๊ณผ ์–ดํœ˜/ํ‚ค์›Œ๋“œ ๊ฒ€์ƒ‰(Lexical retrieval)์„ ๋ณ‘๋ ฌ๋กœ ์‹คํ–‰ํ•˜๊ณ  ์ƒํ˜ธ ์ˆœ์œ„ ์œตํ•ฉ(Reciprocal Rank Fusion)์œผ๋กœ ๋ณ‘ํ•ฉํ•œ ๋‹ค์Œ, Re-ranker๊ฐ€ ์ตœ์ข… ์ปจํ…์ŠคํŠธ๋ฅผ ์„ ํƒํ•˜๋Š” ํŒจํ„ด์„ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค [2]. Vertex AI Search ๊ฐ™์€ ๊ณ ๊ธ‰ ๊ฒ€์ƒ‰ ์—”์ง„ ์—ญ์‹œ ์ด์™€ ์œ ์‚ฌํ•˜๊ฒŒ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๊ฒ€์ƒ‰ ํ›„ Re-ranker๊ฐ€ ๊ฒฐ๊ณผ ์ ์ˆ˜๋ฅผ ๋‹ค์‹œ ๋งค๊ฒจ ๊ฐ€์žฅ ๊ด€๋ จ์„ฑ ๋†’์€ ๋ฌธ์„œ๋ฅผ ๋ฐ˜ํ™˜ํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค [3]. * **๊ต์ฐจ ์ธ์ฝ”๋”(Cross-encoder)๋ฅผ ํ†ตํ•œ ์„ฑ๋Šฅ ๊ทน๋Œ€ํ™”:** ๋กœ์ปฌ ํ™˜๊ฒฝ์˜ RAG ์‹œ์Šคํ…œ์—์„œ๋Š” CPU์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์†Œํ˜• ๊ต์ฐจ ์ธ์ฝ”๋”๋ฅผ Re-ranker๋กœ ํ™œ์šฉํ•˜์—ฌ ์ƒ์œ„ 20๊ฐœ ์ •๋„์˜ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ์ˆœ์œ„๋ฅผ ์žฌ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค [4]. ์ด ๊ณผ์ •์„ ๊ฑฐ์น˜๋ฉด ๊ฒ€์ƒ‰ ์‹œ์Šคํ…œ์˜ ์ˆ˜์ค€์ด ํฌ๊ฒŒ ์ฐจ์ด ๋‚  ์ •๋„๋กœ ์ ํ•ฉ์„ฑ ๋†’์€ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [4]. * **๊ฒ€์ƒ‰ ๋ชจ๋ธ์˜ ํ•œ๊ณ„ ๋ณด์™„:** ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€ ๋“ฑ ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ ๊ฒฉ์ฐจ(Modality gap)๊ฐ€ ํด ๋•Œ ์ด๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ๊ต์ฐจ ๋ชจ๋‹ฌ(Cross-modal) ๊ฒ€์ƒ‰์—์„œ Re-ranking ๋‹จ๊ณ„๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [6]. ๋˜ํ•œ Cohere ๋ชจ๋ธ์ฒ˜๋Ÿผ ๋Œ€์กฐ ํ•™์Šต(Contrastive training) ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ '์งˆ๋ฌธ ๊ตฌ๋ฌธ๊ณผ ๋ฌธ์„œ ๊ตฌ๋ฌธ'์˜ ๋ถˆ์ผ์น˜๋กœ ์ธํ•ด ๋‹จ๋… ์‚ฌ์šฉ ์‹œ ์–ด๋ ค์›€์„ ๊ฒช์„ ์ˆ˜ ์žˆ๋Š”๋ฐ, ์ด๋ฅผ ์œ„ํ•ด ์„ค๊ณ„๋œ ์ž์ฒด Re-ranker๋ฅผ ํ•จ๊ป˜ ๊ฒฐํ•ฉํ•˜๋ฉด ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค [7, 8]. ### โš–๏ธ Trade-offs & Caveats * **์ฒญํฌ ์ค‘๋ณต์— ๋”ฐ๋ฅธ ํ˜ผ๋ž€ ์œ„ํ—˜:** RAG ์‹œ์Šคํ…œ์„ ์œ„ํ•ด ๋ฌธ์„œ๋ฅผ ๋‚˜๋ˆŒ ๋•Œ ์ฒญํฌ ๊ฒน์นจ(Overlap) ๋น„์œจ์ด ๋„ˆ๋ฌด ๋†’์œผ๋ฉด(์˜ˆ: 50%) ์ค‘๋ณต๋œ ๋ฒกํ„ฐ๊ฐ€ ๋‹ค์ˆ˜ ์ƒ์„ฑ๋˜์–ด Re-ranker์— ํ˜ผ๋ž€์„ ์ค„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [9]. ์ด ์ œ์•ฝ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ค‘๋ณต ๋น„์œจ์„ 15% ์ˆ˜์ค€์œผ๋กœ ๋‚ฎ์ถ”๋Š” ๋“ฑ์˜ ํŠœ๋‹์ด ์š”๊ตฌ๋ฉ๋‹ˆ๋‹ค [9]. * **์•„ํ‚คํ…์ฒ˜ ๋ณต์žก๋„ ์ฆ๊ฐ€:** Re-ranking์„ ์ ์šฉํ•˜๋ฉด ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ผ๋Š” ๋‹จ์ผ ๊ณ„์ธต ์™ธ์—๋„ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ผ์šฐํŒ…, Re-ranking ์•Œ๊ณ ๋ฆฌ์ฆ˜, ๊ถŒํ•œ ์ธ์‹ ํ•„ํ„ฐ๋ง ๋“ฑ ์—ฌ๋Ÿฌ ๊ณ„์ธต์ด ๊ฒ€์ƒ‰ ์Šคํƒ์— ์ถ”๊ฐ€๋˜๋ฏ€๋กœ ์‹œ์Šคํ…œ์˜ ์ „๋ฐ˜์ ์ธ ๋ณต์žก๋„๊ฐ€ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค [10]. * **๋‹ค๋‹จ๊ณ„ ์ฒ˜๋ฆฌ์— ๋”ฐ๋ฅธ ์ž์› ์†Œ๋ชจ:** ๋ฌธ์„œ ์„ธํŠธ๋ฅผ 1์ฐจ๋กœ ๊ฒ€์ƒ‰ํ•œ ํ›„ ์ƒ์œ„ ๊ฒฐ๊ณผ๋ฅผ ๋‹ค์‹œ ํ‰๊ฐ€ํ•ด์•ผ ํ•˜๋ฏ€๋กœ, ๋‹จ์ผ ๊ฒ€์ƒ‰ ๋ชจ๋ธ๋งŒ ์‚ฌ์šฉํ•  ๋•Œ์— ๋น„ํ•ด ์ถ”๊ฐ€์ ์ธ ์—ฐ์‚ฐ ์ž์›๊ณผ ์‹œ๊ฐ„์ด ์š”๊ตฌ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [4, 5]. --- *Last updated: 2026-05-04* ---