--- id: [[P-Reinforce|P-Reinforce]]-AUTO-MCLE-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 0.99 tags: [auto-reinforced, machine-learning, ml, algorithms, statistical-learning, data-driven] last_reinforced: 2026-04-20 --- # [[Machine Learning (ML)|Machine Learning (ML)]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "슀슀둜 λ°°μš°λŠ” ν”„λ‘œκ·Έλž˜λ°: κ°œλ°œμžκ°€ λͺ¨λ“  κ·œμΉ™μ„ 일일이 μ½”λ”©(If-Else)ν•˜λŠ” λŒ€μ‹ , μ»΄ν“¨ν„°μ—κ²Œ μ—„μ²­λ‚œ μ–‘μ˜ 데이터λ₯Ό 보여주고 κ·Έ μ•ˆμ— μˆ¨κ²¨μ§„ 'κ·œμΉ™κ³Ό νŒ¨ν„΄'을 λͺ¨λΈμ΄ 슀슀둜 μ°Ύμ•„λ‚΄κ²Œ λ§Œλ“œλŠ” 톡계적 μ§€λŠ₯ κ΅¬μΆ•μˆ ." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) 기계 ν•™μŠ΅(Machine Learning)은 λ°μ΄ν„°λ‘œλΆ€ν„° 슀슀둜 ν•™μŠ΅ν•˜κ³  μ˜ˆμΈ‘ν•˜λŠ” μ•Œκ³ λ¦¬μ¦˜μ„ κ°œλ°œν•˜λŠ” ν•™λ¬Έ λΆ„μ•Όμž…λ‹ˆλ‹€. 1. **3λŒ€ ν•™μŠ΅ μœ ν˜•**: * **Supervised Learning (지도 ν•™μŠ΅)**: μ •λ‹΅(Label)이 μžˆλŠ” λ°μ΄ν„°λ‘œ 곡뢀 (슀팸 λΆ„λ₯˜ λ“±). * **Unsupervised Learning (비지도 ν•™μŠ΅)**: μ •λ‹΅ 없이 λ°μ΄ν„°μ˜ κ΅¬μ‘°λ‚˜ ꡰ집을 발견 (고객 μ„ΈλΆ„ν™” λ“±). * **Reinforcement Learning (κ°•ν™” ν•™μŠ΅)**: μ‹œν–‰μ°©μ˜€μ™€ 보상을 톡해 졜적의 행동 선택 (μ•ŒνŒŒκ³  λ“±). 2. **μ™œ μ€‘μš”ν•œκ°€?**: * 인간이 말둜 λ‹€ μ„€λͺ…ν•  수 μ—†λŠ” λ³΅μž‘ν•œ νŒ¨ν„΄(이미지 인식, μžμ—°μ–΄ 이해 λ“±)을 컴퓨터가 λΉ„μ•½μ μœΌλ‘œ 잘 μ²˜λ¦¬ν•˜κ²Œ λ§Œλ“  ν˜„λŒ€ IT 기술의 κ°€μž₯ κ±°λŒ€ν•œ νŒ¨λŸ¬λ‹€μž„ μ‹œν”„νŠΈμž„. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±°μ—λŠ” μ‚¬λžŒμ΄ 직접 νŠΉμ§•(Feature)을 섀계해 주던 '전톡적 ML μ •μ±…'μ΄μ—ˆμœΌλ‚˜, ν˜„λŒ€ 정책은 기계가 νŠΉμ§•κΉŒμ§€ 슀슀둜 μ°Ύμ•„λ‚΄λŠ” 'λ”₯λŸ¬λ‹ μ •μ±…'으둜 μ£Όλ₯˜κ°€ μ™„μ „νžˆ 이동함(RL Update). (Deep Learning (DL)와 μ—°κ²°) - **μ •μ±… λ³€ν™”(RL Update)**: λ‹¨μˆœνžˆ μ„±λŠ₯만 λ†’μ΄λŠ” μ •μ±…μ—μ„œ, λͺ¨λΈμ΄ μ™œ 그런 κ²°κ³Όλ₯Ό λƒˆλŠ”μ§€ μ„€λͺ…ν•˜λ €λŠ” 'XAI(μ„€λͺ… κ°€λŠ₯ν•œ AI) μ •μ±…'κ³Ό λ°μ΄ν„°μ˜ 편ν–₯을 λ°”λ‘œμž‘λŠ” '윀리적 ν•™μŠ΅ μ •μ±…'이 ν•„μˆ˜ 섀계 μš”μ†Œ 정책이 됨. ([[Ethics & AI|Ethics & AI]]와 μ—°κ²°) ## πŸ”— 지식 μ—°κ²° (Graph) - Deep Learning (DL), [[Reinforcement Learning (RL)|Reinforcement Learning (RL)]], [[Explainable-AI (XAI)|Explainable-AI (XAI)]], [[Optimization|Optimization]], [[Inferential-Statistics|Inferential-Statistics]] - **Modern Tech/Tools**: Scikit-learn, XGBoost, PyTorch, TensorFlow, Google Vertex AI. ---