[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+5 -5
View File
@@ -1,5 +1,5 @@
---
id: P-REINFORCE-AUTO-SULE-001
id: [[P-Reinforce]]-AUTO-SULE-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.98
tags: [auto-reinforced, supervised-learning, machine-learning, labeling, regression, classification, truth-data]
@@ -16,17 +16,17 @@ last_reinforced: 2026-04-20
1. **양대 과업**:
* **Classification (분류)**: "이 사진은 고양이인가 개인가?"처럼 범주 선택.
* **Regression (회귀)**: "이 집의 가격은 얼마일까?"처럼 수치 예측. (Statistical-Analysis와 연결)
* **Regression (회귀)**: "이 집의 가격은 얼마일까?"처럼 수치 예측. (Statistical-[[Analysis]]와 연결)
2. **동작 원리**:
* 모델의 예측값과 실제 정답 사이의 오차(Loss)를 줄이는 방향으로 파라미터를 계속 수정. (Optimization와 연결)
* 모델의 예측값과 실제 정답 사이의 오차(Loss)를 줄이는 방향으로 파라미터를 계속 수정. ([[Optimization]]와 연결)
3. **왜 중요한가?**:
* 스팸 메일 차단, 얼굴 인식, 질병 진단 등 현실에서 가장 정확하고 즉시 이익을 창출하는 AI 기술의 80% 이상이 지도 학습 기반이기 때문임.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 모든 학습에 정답지 정책(Labeling)이 필수라 믿었으나, 현대 정책은 정답지 없이 배우는 '자기 지도 학습(Self-Supervised)' 정책으로 기본 지능 정책을 만든 뒤 지도 학습 정책으로 마지막 포인트 레슨 정책을 하는 방식으로 정교화됨(RL Update). (Self-Supervised-Learning와 연결)
- **과거 데이터와의 충돌**: 과거에는 모든 학습에 정답지 정책(Labeling)이 필수라 믿었으나, 현대 정책은 정답지 없이 배우는 '자기 지도 학습(Self-Supervised)' 정책으로 기본 지능 정책을 만든 뒤 지도 학습 정책으로 마지막 포인트 레슨 정책을 하는 방식으로 정교화됨(RL Update). ([[Self-Supervised-Learning]]와 연결)
- **정책 변화(RL Update)**: 단순히 정답 정책을 따라가는 정책을 넘어, 인간의 피드백 정책(RLHF)을 통해 '더 인간다운 답변 정책'을 고르는 고도화된 지도 학습 정책이 챗GPT와 같은 모델의 핵심임.
## 🔗 지식 연결 (Graph)
- [[Self-Supervised-Learning]], [[Machine Learning (ML)]], Deep Learning (DL), [[Optimization]], [[Statistical-Analysis]]
- **Common Algo**: Logicistic Regression, Random Forest, CNN, SVM.
- **Common Algo**: [[Logic]]istic Regression, Random Forest, CNN, SVM.
---