# Foundational LLM Concepts (LLM ๊ธฐ์ดˆ ๊ฐœ๋…) ## ๐Ÿ“Œ Brief Summary Foundational LLM Concepts๋Š” ์—์ด์ „ํ‹ฑ ์‹œ์Šคํ…œ์˜ ๋‘๋‡Œ ์—ญํ• ์„ ํ•˜๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ๋ณธ์งˆ์ ์ธ ํŠน์„ฑ, ์•„ํ‚คํ…์ฒ˜์  ํ•œ๊ณ„, ๊ทธ๋ฆฌ๊ณ  ์—์ด์ „ํŠธ ๊ตฌ์ถ• ์‹œ ๊ณ ๋ คํ•ด์•ผ ํ•  ํ•ต์‹ฌ ์›๋ฆฌ๋ฅผ ๋‹ค๋ฃฌ๋‹ค. ๋ชจ๋ธ์˜ ํ™•๋ฅ ๋ก ์  ํŠน์„ฑ๊ณผ ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ ๋ฐฉ์‹์— ๋Œ€ํ•œ ๊นŠ์€ ์ดํ•ด๋Š” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์—์ด์ „ํŠธ ํ•˜๋„ค์Šค๋ฅผ ์„ค๊ณ„ํ•˜๋Š” ๋ฐ ํ•„์ˆ˜์ ์ธ ๊ธฐ์ดˆ ์ง€์‹์ด๋‹ค. ## ๐Ÿ“– Core Content * **LLM์˜ ๋ณธ์งˆ์  ํŠน์„ฑ**: * **ํ™•๋ฅ ๋ก ์  ์ƒ์„ฑ (Probabilistic Generation)**: ๋‹ค์Œ ๋‹จ์–ด๋ฅผ ํ™•๋ฅ ์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ์„ ํƒํ•˜๋ฏ€๋กœ ๋™์ผํ•œ ์ž…๋ ฅ์—๋„ ๊ฒฐ๊ณผ๊ฐ€ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๋Š” ๋น„๊ฒฐ์ •์„ฑ(Non-determinism)์„ ๊ฐ€์ง. * **์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ (Context Window)**: ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋ณด์˜ ์–‘์ด ์ œํ•œ๋˜์–ด ์žˆ์œผ๋ฉฐ, ์ด๋ฅผ ์ดˆ๊ณผํ•˜๋ฉด ์ด์ „ ์ •๋ณด๋ฅผ ๋ง๊ฐํ•˜๊ฑฐ๋‚˜ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋จ. * **Long-context Models**: ๋ฐฑ๋งŒ ํ† ํฐ ์ด์ƒ์˜ ๋ฐฉ๋Œ€ํ•œ ์ปจํ…์ŠคํŠธ๋ฅผ ์ง€์›ํ•˜๋Š” ์ตœ์‹  ๋ชจ๋ธ๋“ค(Gemini 1.5, GPT-4o ๋“ฑ)์˜ ํŠน์„ฑ๊ณผ ์—์ด์ „ํ‹ฑ ์›Œํฌํ”Œ๋กœ์šฐ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ. * **๋น„๊ฒฐ์ •์„ฑ (Non-determinism) ์ œ์–ด**: ํ™•๋ฅ ์ ์ธ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ์‹œ์Šคํ…œ์ ์œผ๋กœ ํ†ต์ œํ•˜๊ธฐ ์œ„ํ•ด ์˜จ๋„(Temperature) ์กฐ์ ˆ, Top-p ์„ค์ •, ๊ทธ๋ฆฌ๊ณ  ํ•˜๋„ค์Šค ๊ณ„์ธต์˜ ๊ฒฐ์ •๋ก ์  ๊ฒ€์ฆ ๊ฒŒ์ดํŠธ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ธฐ๋ฒ•. * **ํ† ํฐ ๊ฒฝ์ œํ•™ (Token Economics)**: ์ž…๋ ฅ๊ณผ ์ถœ๋ ฅ ํ† ํฐ์˜ ๋น„์šฉ๊ณผ ์ถ”๋ก  ์†๋„(Latency) ์‚ฌ์ด์˜ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ์ตœ์ ํ™”ํ•˜์—ฌ ๊ฒฝ์ œ์ ์ธ ์‹œ์Šคํ…œ ๊ตฌ์ถ•. * **๋ชจ๋ธ ์ •๋ ฌ (Alignment)**: ๋ชจ๋ธ์ด ์ธ๊ฐ„์˜ ์˜๋„์™€ ๊ฐ€์น˜๊ด€์— ๋ถ€ํ•ฉํ•˜๋„๋ก ํ•™์Šต(RLHF ๋“ฑ)๋œ ์ •๋„์™€, ์ด๊ฒƒ์ด ์—์ด์ „ํŠธ์˜ ์ง€์‹œ ์ค€์ˆ˜ ๋Šฅ๋ ฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ. ## โš–๏ธ Trade-offs & Caveats * **์ถ”๋ก  ์„ฑ๋Šฅ vs ์†๋„**: ๋ชจ๋ธ์˜ ํฌ๊ธฐ๊ฐ€ ์ปค์งˆ์ˆ˜๋ก ์ง€๋Šฅ์€ ๋†’์•„์ง€์ง€๋งŒ ๋ฐ˜์‘ ์†๋„๋Š” ๋А๋ ค์ง€๊ณ  ๋น„์šฉ์€ ์ฆ๊ฐ€ํ•œ๋‹ค. * **์ปจํ…์ŠคํŠธ ํฌ๊ธฐ vs ์ง‘์ค‘๋ ฅ**: ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ๊ฐ€ ์ปค์ ธ๋„ ๋ชจ๋ธ์ด ์ค‘๊ฐ„์— ์œ„์น˜ํ•œ ์ •๋ณด์— ์†Œํ™€ํ•ด์ง€๋Š” 'Lost in the Middle' ํ˜„์ƒ์€ ์—ฌ์ „ํžˆ ์กด์žฌํ•  ์ˆ˜ ์žˆ๋‹ค. * **์ฐฝ์˜์„ฑ vs ์‹ ๋ขฐ์„ฑ**: ๋ชจ๋ธ์˜ ์ž์œ ๋„๋ฅผ ๋†’์ด๋ฉด ์ฐฝ์˜์ ์ธ ํ•ด๊ฒฐ์ฑ…์ด ๋‚˜์˜ค์ง€๋งŒ, ๋™์‹œ์— ํ™˜๊ฐ(Hallucination)๊ณผ ์˜ค๋ฅ˜์˜ ์œ„ํ—˜๋„ ํ•จ๊ป˜ ์ฆ๊ฐ€ํ•œ๋‹ค. ## ๐Ÿ”— Knowledge Connections ### Related Concepts * [[Reasoning & Planning|Reasoning & Planning]] * ์—ฐ๊ฒฐ ์ด์œ : LLM์˜ ๊ธฐ์ดˆ์ ์ธ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ฐ”ํƒ•์œผ๋กœ ๋ณต์žกํ•œ ๊ณ„ํš ์ˆ˜๋ฆฝ ๋Šฅ๋ ฅ์ด ๊ตฌ์ถ•๋œ๋‹ค. * [[Context Engineering|Context Engineering]] * ์—ฐ๊ฒฐ ์ด์œ : LLM์˜ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ ํ•œ๊ณ„๋ฅผ ๊ธฐ์ˆ ์ ์œผ๋กœ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋ก ์ด๋‹ค. * [[Agentic AI Security|Agentic AI Security]] * ์—ฐ๊ฒฐ ์ด์œ : LLM์˜ ์ทจ์•ฝ์ (์ธ์ ์…˜ ๋“ฑ)์„ ๋ฐฉ์–ดํ•˜๋Š” ๋ณด์•ˆ ์ฒด๊ณ„์™€ ์ง๊ฒฐ๋œ๋‹ค. ### Deeper Research Questions * ๋ชจ๋ธ์˜ 'ํŒŒ๋ผ๋ฏธํ„ฐ ์ง€์‹'๊ณผ '์ปจํ…์ŠคํŠธ ์ง€์‹'์ด ์—์ด์ „ํŠธ์˜ ์ตœ์ข… ํŒ๋‹จ์—์„œ ๊ฐ๊ฐ ์–ด๋А ์ •๋„์˜ ๋น„์ค‘์„ ์ฐจ์ง€ํ•˜๋Š”์ง€ ์ •๋Ÿ‰์ ์œผ๋กœ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€? * ํŠน์ • ๋„๋ฉ”์ธ(์ฝ”๋”ฉ, ๋ฒ•๋ฅ , ์˜๋ฃŒ)์— ํŠนํ™”๋œ ์†Œํ˜• ๋ชจ๋ธ(SLM)์ด ๋Œ€ํ˜• ๋ชจ๋ธ(LLM)๋ณด๋‹ค ์—์ด์ „ํŠธ ํ•˜๋„ค์Šค ๋‚ด๋ถ€์—์„œ ๋” ํšจ์œจ์ ์œผ๋กœ ์ž‘๋™ํ•  ์ˆ˜ ์žˆ๋Š” ์กฐ๊ฑด์€ ๋ฌด์—‡์ธ๊ฐ€? * ๋ชจ๋ธ์˜ ๋น„๊ฒฐ์ •์„ฑ์„ ์—ญ์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ, ์—ฌ๋Ÿฌ ๋ฒˆ์˜ ๋…๋ฆฝ์ ์ธ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๊ณ  ํ•ฉ์˜๋ฅผ ๋„์ถœํ•˜๋Š” '์•™์ƒ๋ธ” ์ถ”๋ก '์˜ ํšจ๊ณผ๋Š” ์–ด๋– ํ•œ๊ฐ€? ### Practical Application Contexts * **Implementation:** ์ž‘์—…์˜ ๋‚œ์ด๋„์— ๋”ฐ๋ผ ์ €๋ ดํ•˜๊ณ  ๋น ๋ฅธ ๋ชจ๋ธ(GPT-4o mini)๊ณผ ๊ฐ•๋ ฅํ•˜์ง€๋งŒ ๋น„์‹ผ ๋ชจ๋ธ(Claude 3.5 Sonnet)์„ ํ˜ผํ•ฉํ•˜์—ฌ ์‚ฌ์šฉํ•˜๋Š” ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์„ค๊ณ„ํ•œ๋‹ค. * **System Design:** ์—์ด์ „ํŠธ์˜ ๋‹ต๋ณ€ ์ผ๊ด€์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด `seed` ๊ฐ’์„ ๊ณ ์ •ํ•˜๊ฑฐ๋‚˜, ์ค‘์š”ํ•œ ๋กœ์ง์—์„œ๋Š” `temperature=0`์œผ๋กœ ์„ค์ •ํ•˜์—ฌ ๊ฒฐ์ •๋ก ์  ๋‹ต๋ณ€์„ ์œ ๋„ํ•œ๋‹ค. --- *Last updated: 2026-05-01*