bluemsi/2nd

Files

T

Antigravity Agent fdfbc83535 Fix: Restore unified Topics folder and reorganize specialized category folders

2026-05-02 23:25:02 +09:00

2.4 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AUTO-SULE-001

Business

0.98

auto-reinforced

supervised-learning

machine-learning

labeling

regression

classification

truth-data

2026-04-20

Supervised-Learning

📌 한 줄 통찰 (The Karpathy Summary)

"정답이 있는 공부: 문제(Data)와 정답(Label)이 짝지어진 데이터를 반복 학습하여, 나중에 새로운 문제가 나왔을 때 과거의 정답 패턴을 토대로 정답을 '예측'하게 만드는 가장 확실하고 강력한 조기 교육 기술."

📖 구조화된 지식 (Synthesized Content)

지도 학습(Supervised-Learning)은 정답(레이블)이 포함된 데이터를 사용하여 모델을 학습시키는 머신러닝의 가장 보편적인 유형입니다.

양대 과업:
- Classification (분류): "이 사진은 고양이인가 개인가?"처럼 범주 선택.
- Regression (회귀): "이 집의 가격은 얼마일까?"처럼 수치 예측. (Statistical-Analysis와 연결)
동작 원리:
- 모델의 예측값과 실제 정답 사이의 오차(Loss)를 줄이는 방향으로 파라미터를 계속 수정. (Optimization와 연결)
왜 중요한가?:
- 스팸 메일 차단, 얼굴 인식, 질병 진단 등 현실에서 가장 정확하고 즉시 이익을 창출하는 AI 기술의 80% 이상이 지도 학습 기반이기 때문임.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 과거에는 모든 학습에 정답지 정책(Labeling)이 필수라 믿었으나, 현대 정책은 정답지 없이 배우는 '자기 지도 학습(Self-Supervised)' 정책으로 기본 지능 정책을 만든 뒤 지도 학습 정책으로 마지막 포인트 레슨 정책을 하는 방식으로 정교화됨(RL Update). (Self-Supervised-Learning와 연결)
정책 변화(RL Update): 단순히 정답 정책을 따라가는 정책을 넘어, 인간의 피드백 정책(RLHF)을 통해 '더 인간다운 답변 정책'을 고르는 고도화된 지도 학습 정책이 챗GPT와 같은 모델의 핵심임.

🔗 지식 연결 (Graph)

Self-Supervised-Learning, Machine Learning (ML), Deep Learning (DL), Optimization, Statistical-Analysis
Common Algo: Logicistic Regression, Random Forest, CNN, SVM.