chore(wiki): reinforce knowledge batch #6-#10 (200 docs milestone)

This commit is contained in:
Antigravity Agent
2026-04-26 15:07:47 +09:00
parent f541717fe1
commit c612160a13
265 changed files with 8026 additions and 1113 deletions
@@ -1,30 +1,28 @@
---
id: P-REINFORCE-AI-HYPERPARAM
id: HYPER-OPT-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.96
tags: [AI, MachineLearning, Hyperparameter, Optimization]
last_reinforced: 2026-04-20
confidence_score: 1.0
tags: [machine-learning, optimization, automl, deep-learning]
last_reinforced: 2026-04-26
---
# [[Hyperparameter-Optimization]] (하이퍼파라미터 최적화)
# [[Hyperparameter Optimization (하이퍼파라미터 최적화)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "학습을 배우는 기술, 모델의 성튜닝하는 과정." 모델이 스스로 학습하는 가중치(Weight)가 아니라, 학습 방식 자체를 결정하는 설정값(배치 크기, 학습률 등)의 최적 조합을 찾는 과정이다.
> "모델의 성결정짓는 '튜닝 레버'들의 최적 조합을 찾아라" — 학습률, 배치 크기, 레이어 수 등 학습 과정에서 자동으로 학습되지 않는 설정값(Hyperparameters)들을 체계적으로 탐색하여 성능을 극대화하는 과정.
## 📖 구조화된 지식 (Synthesized Content)
- **Key Parameters**:
- **Learning Rate**: 가중치 업데이트의 크기.
- **Batch Size**: 한 번에 학습할 데이터 뭉치의 크기.
- **Number of Layers/Neurons**: 신경망의 구조적 크기.
- **Methods**:
- **Grid Search**: 모든 조합을 격자무늬로 다 시도함 (느림).
- **Random Search**: 무작위로 조합을 골라 시도함 (은근히 효과적).
- **Bayesian Optimization**: 이전 시도 결과를 바탕으로 유망한 조합을 예측하며 탐색 (Gausean Process 등 활용).
- **Goal**: 검증 데이터(Validation set)에 대해 최고의 성능을 내는 설정을 확보하는 것.
- **추출된 패턴:** 주어진 데이터와 모델 구조에서 최상의 결과를 내는 매개변수 조합을 탐색(Exploration)과 활용(Exploitation)의 균형을 통해 효율적으로 찾아내는 패턴.
- **세부 내용:**
- **Grid Search:** 모든 가능한 조합을 격자 형태로 전수 조사. 확실하지만 비용이 매우 높음.
- **Random Search:** 파라미터 공간을 무작위로 샘플링. Grid Search보다 효율적임이 증명됨.
- **Bayesian Optimization:** 이전 시도의 결과를 바탕으로 확률 모델을 구축하여 유망한 영역을 집중 탐색 (예: Gaussian Processes 활용).
- **Hyperband:** 리소스를 적게 할당해 많은 후보를 테스트한 뒤, 유망한 후보에게만 더 많은 리소스를 할당하는 효율적 전략.
## ⚠️ 모순 및 업데이트 (RL Update)
- 하이퍼파라미터 튜닝 자체에 너무 많은 컴퓨팅 자원을 쓰는 것은 '주객전도'가 될 수 있다. 최근에는 **AutoML**이나 **Population Based Training (PBT)** 등을 통해 학습 중간에 실시간으로 하이퍼파라미터를 진화시키는 방식이 대형 모델 학습에서 표준으로 쓰이고 있다.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 장인의 '경험'에 의존하던 수동 튜닝에서, 알고리즘이 자동으로 최적값을 찾는 AutoML(Automated Machine Learning) 시대로 전환.
- **정책 변화:** Antigravity 에이전트의 내부 모델 튜닝 시, 베이지안 최적화를 기본 알고리즘으로 채택하여 최소한의 시도로 최적의 추론 온도를 결정함.
## 🔗 지식 연결 (Graph)
- Related: [[Gradient-Descent]] , [[AutoML]]
- Concept: [[Overfitting-vs-Underfitting]]
- [[AutoML]], [[Gaussian-Processes]], [[Machine-Learning-Lifecycle]], [[Deep-Learning]]
- **Raw Source:** [[10_Wiki/Topics/AI/Hyperparameter-Optimization.md]]