2.6 KiB
2.6 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| AI-SUP-LEARN-001 | Business | 1.0 |
|
2026-04-26 |
Supervised Learning Foundations (지도 학습 기초)
📌 한 줄 통찰 (The Karpathy Summary)
"풍부한 '문제'와 선명한 '해설지(Labels)'를 기계에게 제시하고, 오차를 줄여나가는 집요한 반복을 통해 미지의 입력에 대한 정답을 맞히는 '예측의 지도'를 완성하라" — 입력 데이터와 그에 대응하는 정답이 주어진 상태에서 모델을 학습시켜 새로운 데이터의 출력값을 예측하는 머신러닝의 가장 대표적인 방법론.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: "Feature-to-Label Mapping and Empirical Risk Minimization" — 입력값(
x)과 출력값(y) 사이의 함수(f(x)=y)를 근사하기 위해, 모델의 예측과 실제 정답 사이의 차이(Loss)를 계산하고 이를 최소화하는 방향으로 파라미터를 업데이트하는 패턴. - 주요 문제 유형:
- Classification: 이산적인 범주 예측 (예: 스팸 메일 분류, 질병 진단).
- Regression: 연속적인 수치 예측 (예: 주택 가격 예측, 매출 전망).
- 핵심 프로세스: 데이터 수집 → 전처리 → 모델 선택 → 학습(Training) → 검증(Validation) → 평가(Testing) → 배포.
- 의의: 기상 예보, 자율주행, 의료 판독 등 정답이 존재하고 데이터 확보가 가능한 거의 모든 실세계 인공지능 응용 분야의 근간이 됨.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 단순히 학습 데이터를 완벽히 외우는 것이 최고라 믿던 시대에서 벗어나, 이제는 학습하지 않은 새로운 데이터에 대한 성능(일반화, Generalization)을 높이기 위해 과적합(Overfitting)을 방지하는 규제(Regularization)와 검증 전략이 모델 설계의 성패를 좌우함.
- 정책 변화: Antigravity 프로젝트는 에이전트의 지식 분류 및 답변 정확도 향상을 위해, 고품질의 레이블링된 데이터를 기반으로 하는 지도 학습 파이프라인을 지능의 핵심 기동 엔진으로 상시 운용함.
🔗 지식 연결 (Graph)
- Deep-Learning-Foundations, Reinforcement-Learning, Self-Supervised-Learning, Performance-Metrics-in-AI
- Raw Source: 10_Wiki/Topics/AI/Supervised-Learning-Foundations.md