--- id: ML-KMEANS-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [machine-learning, unsupervised-learning, clustering, k-means, centroids] last_reinforced: 2026-04-26 --- # K-Means Clustering Foundations (K-Means ν΄λŸ¬μŠ€ν„°λ§ 기초) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "데이터듀 μ‚¬μ΄μ˜ '무게 쀑심'을 μ°Ύμ•„, 혼돈 속에 μˆ¨κ²¨μ§„ 집단(Clusters)의 경계λ₯Ό 그렀라" β€” μ£Όμ–΄μ§„ 데이터λ₯Ό K개의 ν΄λŸ¬μŠ€ν„°λ‘œ λ¬ΆλŠ” μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œ, 각 ν΄λŸ¬μŠ€ν„° λ‚΄μ˜ 데이터와 쀑심점(Centroid) μ‚¬μ΄μ˜ 거리 합을 μ΅œμ†Œν™”ν•˜λŠ” λ°©μ‹μœΌλ‘œ μž‘λ™ν•˜λŠ” 비지도 ν•™μŠ΅μ˜ κ³ μ „. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Iterative Refinement" β€” λ¬΄μž‘μœ„λ‘œ ν• λ‹Ήλœ μ€‘μ‹¬μ μ—μ„œ μ‹œμž‘ν•˜μ—¬, 데이터 ν• λ‹Ή(Assignment)κ³Ό 쀑심점 μ—…λ°μ΄νŠΈ(Update)λ₯Ό λ°˜λ³΅ν•˜λ©° 졜적의 ꡰ집을 μ°Ύμ•„κ°€λŠ” 반볡적 μ΅œμ ν™” νŒ¨ν„΄. - **μž‘λ™ 단계:** - **Initialization:** K개의 초기 쀑심점 μ„€μ • (K-means++ 등을 μ‚¬μš©ν•˜μ—¬ κ°œμ„  κ°€λŠ₯). - **Assignment:** 각 데이터λ₯Ό κ°€μž₯ κ°€κΉŒμš΄ 쀑심점에 ν• λ‹Ή. - **Update:** ν• λ‹Ήλœ λ°μ΄ν„°λ“€μ˜ ν‰κ· κ°’μœΌλ‘œ 쀑심점 이동. - **Convergence:** μ€‘μ‹¬μ μ˜ μœ„μΉ˜ λ³€ν™”κ°€ 없을 λ•ŒκΉŒμ§€ 반볡. - **의의:** 고객 μ„Έκ·Έλ¨ΌνŠΈ 뢄석, 이미지 μ••μΆ•(Color Quantization), μ΄μƒμΉ˜ 탐지 λ“± λ°μ΄ν„°μ˜ μˆ¨κ²¨μ§„ ꡬ쑰λ₯Ό νŒŒμ•…ν•΄μ•Ό ν•˜λŠ” λ‹€μ–‘ν•œ λΆ„μ•Όμ˜ ν† λŒ€. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** μ›ν˜•(Spherical) ν˜•νƒœμ˜ κ΅°μ§‘λ§Œ 잘 μ°ΎλŠ”λ‹€λŠ” ν•œκ³„κ°€ 있으며, μ΅œκ·Όμ—λŠ” λ°μ΄ν„°μ˜ λ³΅μž‘ν•œ κΈ°ν•˜ν•™μ  ꡬ쑰λ₯Ό λ°˜μ˜ν•  수 μžˆλŠ” DBSCANμ΄λ‚˜ μŠ€νŽ™νŠΈλŸ΄ ν΄λŸ¬μŠ€ν„°λ§μœΌλ‘œ λ³΄μ™„λ˜μ–΄ μ‚¬μš©λ¨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” 수만 개의 둜우 데이터 둜그λ₯Ό 의미 λ‹¨μœ„λ‘œ λ¬Άμ–΄ 지식화할 λ•Œ, 초기 필터링 λ‹¨κ³„μ—μ„œ K-Means 기반의 λŒ€κ·œλͺ¨ ν΄λŸ¬μŠ€ν„°λ§μ„ ν™œμš©ν•˜μ—¬ λ°μ΄ν„°μ˜ 쀑볡성을 μ œκ±°ν•¨. ## πŸ”— 지식 μ—°κ²° (Graph) - Unsupervised-Learning-Foundations, [[Dimensionality-Reduction|Dimensionality-Reduction]], Distance-Metrics-in-AI, [[Exploratory-Data-Analysis|Exploratory-Data-Analysis]] - **Raw Source:** 10_Wiki/Topics/AI/K-Means-Clustering-Foundations.md