[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+5 -5
View File
@@ -1,8 +1,8 @@
---
id: P-REINFORCE-AUTO-OPTI-001
id: [[P-Reinforce]]-AUTO-OPTI-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.99
tags: [auto-reinforced, optimization, algorithms, efficiency, mathematical-programming, improvement]
tags: [auto-reinforced, optimization, algorithms, [[Efficiency]], mathematical-programming, improvement]
last_reinforced: 2026-04-20
---
@@ -19,13 +19,13 @@ last_reinforced: 2026-04-20
* **Variables**: 우리가 조정할 수 있는 통제 변수.
* **Constraints**: 우리가 지켜야 할 현실적 제약 조건들.
2. **왜 중요한가?**:
* 지능(Intelligence)은 결국 한정된 자원으로 최선의 목표를 달성하는 '최적화 능력'의 다른 이름이며, AI 학습 자체가 오류를 최소화하는 거대한 최적화 연산이기 때문임. (Gradient-Descent와 연결)
* 지능(Intelligence)은 결국 한정된 자원으로 최선의 목표를 달성하는 '최적화 능력'의 다른 이름이며, AI 학습 자체가 오류를 최소화하는 거대한 최적화 연산이기 때문임. ([[Gradient-Descent]]와 연결)
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 한 번에 정답을 찾는 '분석적 정책(Analytical)'을 선호했으나, 현대 정책은 거대 변수 앞에서는 조금씩 고쳐가며 답에 근접하는 '반복적 경사 하강 정책(Iterative)'이 압도적 실용 정책을 가짐(RL Update). (Iteration와 연결)
- **과거 데이터와의 충돌**: 과거에는 한 번에 정답을 찾는 '분석적 정책(Analytical)'을 선호했으나, 현대 정책은 거대 변수 앞에서는 조금씩 고쳐가며 답에 근접하는 '반복적 경사 하강 정책(Iterative)'이 압도적 실용 정책을 가짐(RL Update). ([[Iteration]]와 연결)
- **정책 변화(RL Update)**: 단순히 현재의 최적 정책(Local Optima)에 만족하지 않고, 전역 최적해(Global Optima)를 찾기 위해 탐색 공간을 뒤흔드는 '하이퍼파라미터 튜닝 정책'과 '강화 학습 정책'이 현대 AI 최적화의 꽃이 됨.
## 🔗 지식 연결 (Graph)
- [[Gradient-Descent]], [[Efficiency]], [[Iteration]], [[Linear-Programming]], [[Search-Optimization]]
- **Modern Tech/Tools**: SGD (Stochastic Gradient Descent), Adam optimizer, Genetic algorithms, Convex optimization.
- **Modern Tech/Tools**: SGD ([[stochastic gradient descent]]), Adam optimizer, Genetic algorithms, Convex optimization.
---