32 lines
2.3 KiB
Markdown
32 lines
2.3 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-MCLE-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.99
|
|
tags: [auto-reinforced, machine-learning, ml, algorithms, statistical-learning, data-driven]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Machine Learning (ML)]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "스스로 배우는 프로그래밍: 개발자가 모든 규칙을 일일이 코딩(If-Else)하는 대신, 컴퓨터에게 엄청난 양의 데이터를 보여주고 그 안에 숨겨진 '규칙과 패턴'을 모델이 스스로 찾아내게 만드는 통계적 지능 구축술."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
기계 학습(Machine Learning)은 데이터로부터 스스로 학습하고 예측하는 알고리즘을 개발하는 학문 분야입니다.
|
|
|
|
1. **3대 학습 유형**:
|
|
* **Supervised Learning (지도 학습)**: 정답(Label)이 있는 데이터로 공부 (스팸 분류 등).
|
|
* **Unsupervised Learning (비지도 학습)**: 정답 없이 데이터의 구조나 군집을 발견 (고객 세분화 등).
|
|
* **Reinforcement Learning (강화 학습)**: 시행착오와 보상을 통해 최적의 행동 선택 (알파고 등).
|
|
2. **왜 중요한가?**:
|
|
* 인간이 말로 다 설명할 수 없는 복잡한 패턴(이미지 인식, 자연어 이해 등)을 컴퓨터가 비약적으로 잘 처리하게 만든 현대 IT 기술의 가장 거대한 패러다임 시프트임.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 사람이 직접 특징(Feature)을 설계해 주던 '전통적 ML 정책'이었으나, 현대 정책은 기계가 특징까지 스스로 찾아내는 '딥러닝 정책'으로 주류가 완전히 이동함(RL Update). (Deep Learning (DL)와 연결)
|
|
- **정책 변화(RL Update)**: 단순히 성능만 높이는 정책에서, 모델이 왜 그런 결과를 냈는지 설명하려는 'XAI(설명 가능한 AI) 정책'과 데이터의 편향을 바로잡는 '윤리적 학습 정책'이 필수 설계 요소 정책이 됨. (Ethics & AI와 연결)
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- Deep Learning (DL), [[Reinforcement Learning (RL)]], [[Explainable-AI (XAI)]], [[Optimization]], [[Inferential-Statistics]]
|
|
- **Modern Tech/Tools**: Scikit-learn, XGBoost, PyTorch, TensorFlow, Google Vertex AI.
|
|
---
|