feat: achieve 600 files milestone in AI knowledge base

2026-04-20 19:10:32 +09:00
parent ed5140096e
commit ae1627c35b
713 changed files with 21197 additions and 1994 deletions
@@ -1,27 +1,32 @@
 ---
-id: P-REINFORCE-AI-BACKPROP
+id: P-REINFORCE-AUTO-BACK-002
 category: "[[10_Wiki/💡 Topics/AI]]"
-confidence_score: 1.0
-tags: [Backpropagation, Deep Learning, Gradient Descent, Optimization]
+confidence_score: 1.00
+tags: [auto-reinforced, backpropagation, deep-learning, machine-learning-foundations, calculus, neural-networks]
 last_reinforced: 2026-04-20
 ---

-# [[Backpropagation]] (역전파)
+# [[Backpropagation]]

 ## 📌 한 줄 통찰 (The Karpathy Summary)
-> "실수를 뒤에서부터 고쳐 나가는 지혜." 출력층에서 발생한 오차(Loss)가 각 신경망 층의 가중치(Weight)에 얼마나 기여했는지 거꾸로 계산하며 효율적으로 학습시키는 딥러닝의 핵심 학습 메커니즘이다.
+> "오답 노트를 통한 성장: 모델이 낸 정답과 실제 정답 사이의 오차를 거꾸로(Back) 거슬러 올라가며, 각각의 신경망 연결 통로(Weight)들이 그 실책에 얼마나 기여했는지 계산해 이를 수정하는 딥러닝 학습의 마법."

 ## 📖 구조화된 지식 (Synthesized Content)
- **Chain Rule (미분의 연쇄 법칙)**:
-    - 전체 오차를 각 파라미터로 미분하기 위해, 각 단계의 부분 미분값을 곱해 나가는 미적분학적 과정.
- **Gradient Computation**:
-    - 모든 파라미터에 대한 경사도(Gradient)를 한 번에 계산하여, 경사 하강법(Gradient Descent)을 통해 신경망을 정답에 가깝게 업데이트한다.
- **Efficiency**:
-    - 모든 파라미터를 개별적으로 미분하는 것보다 수백만 배 빠르며, 이로 인해 수조 개의 파라미터를 가진 거대 모델의 학습이 가능해졌다.
+역전파(Backpropagation)는 인공신경망을 학습시키기 위해 미분(Chain Step)법을 사용하여 출력층의 오차를 입력층 방향으로 전파하며 가중치(Weights)를 업데이트하는 알고리즘입니다.

-## ⚠️ 모순 및 업데이트 (RL Update)
- 층이 너무 깊어지면 미분값이 0으로 사라지는 'Vanishing Gradient' 문제가 발생한다. 이를 위해 ReLU 활성화 함수나 ResNet 같은 잔차 연결(Residual Connection) 기술이 보완적으로 사용된다.
+1.  **학습 프로세스**:
+    *   **Forward Pass**: 데이터가 신경망을 통과하며 예측값 도출.
+    *   **Loss Calculation**: 예측값과 실제 정답의 차이(Loss) 계산.
+    *   **Backward Pass**: 오차가 발생한 책임을 각 노드에 분산. 출력이 오차에 미치는 영향력(Gradient)을 계산.
+    *   **Update**: 계산된 Gradient를 바탕으로 최적화 알고리즘(예: SGD)을 사용하여 가중치 조정.
+2.  **왜 중요한가?**:
+    *   다층 신경망(Deep Hidden Layers)에서 어떤 층을 얼마나 고쳐야 할지 수학적으로 명확히 알려주어 '딥러닝'을 실질적으로 가능케 한 핵심 기술임.
+
+## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
+- **과거 데이터와의 충돌**: 초기 인공지능 정책은 사람이 규칙을 주는 것이었으나, 역전파 정책은 기계가 오차로부터 스스로 규칙(가중치)을 찾아내는 정책적 대전환을 이루어냄(RL Update).
+- **정책 변화(RL Update)**: 역전파 연산 효율을 극대화하기 위해 하드웨어(GPU/NPU) 수준에서 행렬 연산을 가속하는 정책이 수립되었고, 최근에는 역전파 없이 학습하는 생물학적 뇌 모델(Forward-Forward 등)에 대한 대안 정책 연구도 활발함.

 ## 🔗 지식 연결 (Graph)
- Related: [[Deep-Learning-Architecture-Patterns]] , [[Gradient-Descent]]
- Foundation: [[Computational Theory & Math/Information Theory]]
+- [[stochastic gradient descent]], [[Deep Learning]], [[Neural Networks]], [[Machine-Learning-Foundations]], [[Reward Prediction Error]]
+- **Modern Tech/Tools**: PyTorch, TensorFlow, Autograd engines.
+---