2.1 KiB
2.1 KiB
지도 학습 (Supervised Learning)
📌 Brief Summary
지도 학습(Supervised Learning)은 정답(Label)이 포함된 데이터를 통해 입력(Feature)과 출력 사이의 관계를 학습하여 미지의 데이터에 대한 정답을 예측하는 머신러닝 방법론입니다 [1, 2]. 사람이 라벨링한 데이터를 바탕으로 '문제'와 '해설지' 사이의 지도를 그리는 과정에 비유할 수 있습니다 [1].
📖 Core Content
-
주요 문제 유형
- 분류 (Classification): 데이터를 이산적인 범주 중 하나로 나누는 작업입니다 (예: 스팸 메일 분류, 개/고양이 구분) [1, 3].
- 회귀 (Regression): 연속적인 수치를 예측하는 작업입니다 (예: 주택 가격 예측, 매출 전망) [1, 3].
-
학습 프로세스
- 데이터셋 구성: 입력(
x)과 출력(y)의 쌍으로 이루어진 학습 데이터를 준비합니다 [1, 4]. - 오차 최소화 (Loss Minimization): 모델의 예측값과 실제 정답 사이의 차이(Loss)를 계산하고, 이를 최소화하는 방향으로 파라미터를 반복적으로 업데이트합니다 [1, 5].
- 검증 및 평가: 학습하지 않은 데이터에 대한 성능(일반화, Generalization)을 측정하여 과적합(Overfitting) 여부를 확인합니다 [1, 6].
- 데이터셋 구성: 입력(
⚖️ Trade-offs & Caveats
- 라벨링 비용: 고품질의 라벨링된 데이터를 확보하는 데 많은 시간과 비용이 소요됩니다. 이를 극복하기 위해 자기 지도 학습(Self-supervised Learning) 등과 병행되기도 합니다 [1, 7].
- 과적합 (Overfitting): 학습 데이터를 너무 완벽하게 외우면 새로운 데이터에 대한 성능이 떨어질 수 있으므로 규제(Regularization)와 적절한 검증 전략이 필수적입니다 [1, 6].
🔗 Knowledge Connections
- Related Topics: 머신러닝 (Machine Learning), 비지도 학습 (Unsupervised Learning), 자기 지도 학습 (Self-supervised Learning), 손실 함수 (Loss Functions)
- Projects/Contexts: 문서 자동 분류 시스템, 감성 분석 파이프라인
Last updated: 2026-04-30