2nd/10_Wiki/Topics/Supervised-Learning-Foundations.md

---
id: AI-SUP-LEARN-001
category: Unified
confidence_score: 1.0
tags: [ai, machine-learning, [[Supervised-Learning|Supervised-Learning]], classification, regression, model-training, labels]
last_reinforced: 2026-04-26
---

# Supervised Learning Foundations (지도 학습 기초)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "풍부한 '문제'와 선명한 '해설지(Labels)'를 기계에게 제시하고, 오차를 줄여나가는 집요한 반복을 통해 미지의 입력에 대한 정답을 맞히는 '예측의 지도'를 완성하라" — 입력 데이터와 그에 대응하는 정답이 주어진 상태에서 모델을 학습시켜 새로운 데이터의 출력값을 예측하는 머신러닝의 가장 대표적인 방법론.

## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Feature-to-Label Mapping and Empirical Risk Minimization" — 입력값($x$)과 출력값($y$) 사이의 함수($f(x)=y$)를 근사하기 위해, 모델의 예측과 실제 정답 사이의 차이(Loss)를 계산하고 이를 최소화하는 방향으로 파라미터를 업데이트하는 패턴.
- **주요 문제 유형:**
    - **Classification:** 이산적인 범주 예측 (예: 스팸 메일 분류, 질병 진단).
    - **Regression:** 연속적인 수치 예측 (예: 주택 가격 예측, 매출 전망).
- **핵심 프로세스:** 데이터 수집 → 전처리 → 모델 선택 → 학습(Training) → 검증(Validation) → 평가([[Testing|Testing]]) → 배포.
- **의의:** 기상 예보, 자율주행, 의료 판독 등 정답이 존재하고 데이터 확보가 가능한 거의 모든 실세계 인공지능 응용 분야의 근간이 됨.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 학습 데이터를 완벽히 외우는 것이 최고라 믿던 시대에서 벗어나, 이제는 학습하지 않은 새로운 데이터에 대한 성능(일반화, Generalization)을 높이기 위해 과적합([[Overfitting|Overfitting]])을 방지하는 규제([[Regularization|Regularization]])와 검증 전략이 모델 설계의 성패를 좌우함.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 지식 분류 및 답변 정확도 향상을 위해, 고품질의 레이블링된 데이터를 기반으로 하는 지도 학습 파이프라인을 지능의 핵심 기동 엔진으로 상시 운용함.

## 🔗 지식 연결 (Graph)
- [[Deep-Learning|Deep-Learning]]-Foundations, [[Reinforcement-Learning|Reinforcement-Learning]], [[Self-Supervised-Learning|Self-Supervised-Learning]], [[Performance-Metrics-in-AI|Performance-Metrics-in-AI]]
- **Raw Source:** 10_Wiki/Topics/AI/Supervised-Learning-Foundations.md