chore(wiki): reinforce knowledge batch #11-#12 (240 docs milestone)

This commit is contained in:
Antigravity Agent
2026-04-26 15:31:26 +09:00
parent c612160a13
commit b08b092ec8
71 changed files with 2075 additions and 106 deletions
+19 -20
View File
@@ -1,32 +1,31 @@
---
id: P-REINFORCE-AUTO-GRDE-001
id: OPT-GRAD-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.99
tags: [auto-reinforced, gradient-descent, optimization, deep-learning, machine-learning, backpropagation]
last_reinforced: 2026-04-20
confidence_score: 1.0
tags: [ai, optimization, mathematics, gradient-descent, machine-learning]
last_reinforced: 2026-04-26
---
# [[Gradient-Descent]]
# [[Gradient Descent Foundations (경사 하강법 기초)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "안개 낀 산 내려오기: 복잡한 수만 개의 변수들로 이루어진 오차의 산(Error Surface)에서, 현재 위치의 경사(Gradient)를 따라 가장 가파르게 낮아지는 방향으로 한 걸음씩 이동하며 시스템의 오차를 최소화해 나가는 학습의 행동 강령."
> "어둠 속에서 지형의 기울기만을 느끼며 가장 낮은 골짜기를 향해 끈기 있게 내려가라" — 모델의 예측값과 실제값 사이의 오차(Loss)를 정의하고, 이 오차를 최소화하는 방향으로 파라미터를 점진적으로 수정해 나가는 인공지능 학습의 근본 알고리즘.
## 📖 구조화된 지식 (Synthesized Content)
경사 하강법(Gradient-Descent)은 미분 가능한 함수의 최솟값을 찾는 최적화 알고리즘입니다. 현대 AI 학습의 심장부입니다.
1. **작동 원리**:
* **Gradient**: 함수의 기울기. 이 방향의 반대쪽으로 가야 오차가 줄어듦.
* **Learning Rate ($\eta$)**: 한 발자국의 크기. 너무 크면 산을 뛰어넘고(발산), 너무 작으면 내려가는 데 영겁의 시간이 걸림. (Optimization과 연결)
2. **종류**:
* **Batch GD**: 모든 데이터를 다 보고 내림 (정확하지만 느림).
* **Stochastic GD (SGD)**: 데이터 하나 볼 때마다 한 걸음 (빠르지만 요동침).
* **Mini-batch GD**: 적당한 묶음씩 보고 이동 (현실적 타협).
- **추출된 패턴:** 목적 함수의 미분값(Gradient)이 가리키는 방향의 반대 방향으로 학습률(Learning Rate)만큼 파라미터를 업데이트하여, 오차라는 산맥의 최저점을 찾는 반복적 최적화 패턴.
- **핵심 요소:**
- **Learning Rate ($\eta$):** 한 번에 얼마나 멀리 이동할지 결정. 너무 크면 발산하고, 너무 작으면 학습이 느림.
- **Partial Derivative:** 각 파라미터가 오차에 미치는 영향력을 개별적으로 계산.
- **Step:** 현재 위치에서 기울기가 가장 가파른 방향의 반대로 이동하는 한 단계의 연산.
- **주요 변형:**
- **Stochastic Gradient Descent (SGD):** 하나의 데이터 보고 즉시 업데이트. 빠르지만 요동이 심함.
- **Mini-batch SGD:** 적절한 묶음 데이터를 사용하여 속도와 안정성의 균형을 맞춤. 현대 딥러닝의 표준.
- **의의:** 복잡한 신경망의 수백만 개 파라미터를 학습시킬 수 있는 유일하고 실질적인 방법.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 국소 최적해(Local Minima)에 갇혀 영영 빠져나오지 못할 것이라는 비관 정책이 많았으나, 현대 실무 정책은 고차원 공간에서는 대부분이 '안장점(Saddle point)'이며 적절한 소음(Adam 등)이 있으면 벗어날 수 있음을 입증함(RL Update).
- **정책 변화(RL Update)**: 단순히 오차를 줄이는 정책을 넘어, 학습 도중 경사가 소멸(Vanishing)하거나 폭주(Exploding)하는 정책을 막기 위해 배치 정규화(Batch Norm)나 잔차 연결(Residual Connection) 같은 아키텍처적 보조 정책이 필수화됨.
- **과거 데이터와의 충돌:** 단순히 기울기만 따라가던 방식에서, 이제는 관성(Momentum)과 가변 학습률(Adam, RMSProp)을 더해 훨씬 효율적으로 최저점을 찾는 방식으로 진화.
- [[Global-vs-Local-Optima]] 문서와 연계하여, 지역 최적해의 함정을 피하는 것이 경사 하강법 운영의 핵심 기술임.
## 🔗 지식 연결 (Graph)
- [[Optimization]], [[Backpropagation]], [[Deep Learning (DL)]], [[Efficiency]], [[Error Prediction Error (RPE와 유사)]]
- **Modern Tech/Tools**: Adam, RMSprop, Momentum, PyTorch/TensorFlow (Autograd).
---
- [[Backpropagation]], [[Global-vs-Local-Optima]], [[Deep-Learning-Foundations]], [[Mathematics-for-AI]]
- **Raw Source:** [[10_Wiki/Topics/AI/Gradient-Descent.md]]