--- id: GPT-ARCH-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [ai, nlp, gpt, transformer, deep-learning, generative-ai] last_reinforced: 2026-04-26 --- # GPT Architecture Foundations (GPT μ•„ν‚€ν…μ²˜ 기초) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "λ°©λŒ€ν•œ ν…μŠ€νŠΈμ˜ λ°”λ‹€λ₯Ό 슀슀둜 ν•™μŠ΅ν•˜μ—¬, λ‹€μŒμ— 올 단어λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” κ²ƒλ§ŒμœΌλ‘œ 우주적 μ§€λŠ₯에 λ„λ‹¬ν•˜λΌ" β€” 트랜슀포머의 디코더 블둝을 측측이 μŒ“μ•„ 올렀, 이전 λ¬Έλ§₯을 λ°”νƒ•μœΌλ‘œ κ°€μž₯ ν™•λ₯  높은 λ‹€μŒ 토큰을 생성해 λ‚˜κ°€λŠ” 자기 νšŒκ·€μ (Autoregressive) μ–Έμ–΄ λͺ¨λΈμ˜ ν‘œμ€€. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Next Token Prediction"μ΄λΌλŠ” λ‹¨μˆœν•œ λͺ©ν‘œ ν•¨μˆ˜λ₯Ό λŒ€κ·œλͺ¨ 데이터와 νŒŒλΌλ―Έν„°μ— μ μš©ν–ˆμ„ λ•Œ, μΆ”λ‘ κ³Ό μ°½μ˜μ„±μ΄λΌλŠ” μƒμœ„ 인지 λŠ₯λ ₯이 창발(Emergence)ν•˜λŠ” μŠ€μΌ€μΌλ§ 법칙 νŒ¨ν„΄. - **핡심 ꡬ성:** - **Decoder-only Transformer:** 인코더 없이 λ§ˆμŠ€ν‚Ήλœ μ…€ν”„ μ–΄ν…μ…˜(Masked Self-Attention)λ§Œμ„ μ‚¬μš©ν•˜μ—¬ 미래 정보λ₯Ό μ°¨λ‹¨ν•˜κ³  κ³Όκ±° λ¬Έλ§₯μ—λ§Œ 집쀑. - **Causal Self-Attention:** ν˜„μž¬ 토큰이 이전 ν† ν°λ“€κ³Όμ˜ κ΄€κ³„λ§Œμ„ κ³„μ‚°ν•˜λ„λ‘ κ°•μ œ. - **Pre-training & Fine-tuning:** λ°©λŒ€ν•œ 비지도 ν•™μŠ΅μœΌλ‘œ 지식을 μŒ“κ³ , νŠΉμ • νƒœμŠ€ν¬λ‚˜ μ§€μ‹œ 이행(Instruction Following)을 μœ„ν•΄ λ―Έμ„Έ μ‘°μ •. - **의의:** μ‚¬λžŒμ΄ κ·œμΉ™μ„ μ •μ˜ν•˜μ§€ μ•Šμ•„λ„ 데이터 μžμ²΄μ—μ„œ μ–Έμ–΄μ˜ 문법, 논리, 심지어 μ½”λ”© λŠ₯λ ₯κΉŒμ§€ 슀슀둜 μŠ΅λ“ν•¨. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** RNN/LSTM의 순차적 처리 ν•œκ³„λ₯Ό κΉ¨κ³ , 병렬 연산이 κ°€λŠ₯ν•œ μ–΄ν…μ…˜ λ©”μ»€λ‹ˆμ¦˜μ„ 톡해 λͺ¨λΈ 규λͺ¨μ˜ λŒ€ν˜•ν™”λ₯Ό μ‹€ν˜„ν•¨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈμ˜ 핡심 μ—”μ§„(Local/Cloud Brain)은 GPT μ•„ν‚€ν…μ²˜ 기반의 λͺ¨λΈλ“€μ„ μ‚¬μš©ν•˜λ©°, ν”„λ‘œμ νŠΈ νŠΉν™” 지식(Wiki)을 RAGλ‚˜ Fine-tuning을 톡해 톡합함. ## πŸ”— 지식 μ—°κ²° (Graph) - Transformer-Architecture-Foundations, [[LLM]], [[Generative-AI-Impact]], Attention-Mechanism - **Raw Source:** 10_Wiki/Topics/AI/GPT-Architecture-Foundations.md