Files
2nd/10_Wiki/Topics_Business/Supervised-Learning.md
T

2.4 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AUTO-SULE-001 Business 0.98
auto-reinforced
supervised-learning
machine-learning
labeling
regression
classification
truth-data
2026-04-20

Supervised-Learning

📌 한 줄 통찰 (The Karpathy Summary)

"정답이 있는 공부: 문제(Data)와 정답(Label)이 짝지어진 데이터를 반복 학습하여, 나중에 새로운 문제가 나왔을 때 과거의 정답 패턴을 토대로 정답을 '예측'하게 만드는 가장 확실하고 강력한 조기 교육 기술."

📖 구조화된 지식 (Synthesized Content)

지도 학습(Supervised-Learning)은 정답(레이블)이 포함된 데이터를 사용하여 모델을 학습시키는 머신러닝의 가장 보편적인 유형입니다.

  1. 양대 과업:
    • Classification (분류): "이 사진은 고양이인가 개인가?"처럼 범주 선택.
    • Regression (회귀): "이 집의 가격은 얼마일까?"처럼 수치 예측. (Statistical-Analysis와 연결)
  2. 동작 원리:
    • 모델의 예측값과 실제 정답 사이의 오차(Loss)를 줄이는 방향으로 파라미터를 계속 수정. (Optimization와 연결)
  3. 왜 중요한가?:
    • 스팸 메일 차단, 얼굴 인식, 질병 진단 등 현실에서 가장 정확하고 즉시 이익을 창출하는 AI 기술의 80% 이상이 지도 학습 기반이기 때문임.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 모든 학습에 정답지 정책(Labeling)이 필수라 믿었으나, 현대 정책은 정답지 없이 배우는 '자기 지도 학습(Self-Supervised)' 정책으로 기본 지능 정책을 만든 뒤 지도 학습 정책으로 마지막 포인트 레슨 정책을 하는 방식으로 정교화됨(RL Update). (Self-Supervised-Learning와 연결)
  • 정책 변화(RL Update): 단순히 정답 정책을 따라가는 정책을 넘어, 인간의 피드백 정책(RLHF)을 통해 '더 인간다운 답변 정책'을 고르는 고도화된 지도 학습 정책이 챗GPT와 같은 모델의 핵심임.

🔗 지식 연결 (Graph)