chore(wiki): reinforce knowledge batch #11-#12 (240 docs milestone)
This commit is contained in:
@@ -1,28 +1,29 @@
|
||||
---
|
||||
id: HYPER-OPT-001
|
||||
id: OPT-HYPER-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [machine-learning, optimization, automl, deep-learning]
|
||||
tags: [ai, machine-learning, hyperparameter-tuning, bayesian-optimization, model-selection]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Hyperparameter Optimization (하이퍼파라미터 최적화)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "모델의 성능을 결정짓는 '튜닝 레버'들의 최적 조합을 찾아라" — 학습률, 배치 크기, 레이어 수 등 학습 과정에서 자동으로 학습되지 않는 설정값(Hyperparameters)들을 체계적으로 탐색하여 성능을 극대화하는 과정.
|
||||
> "모델 아키텍처가 악기라면, 하이퍼파라미터 최적화는 가장 아름다운 소리를 내기 위해 현을 조율하는 과정이다" — 학습률, 배치 크기, 레이어 수 등 모델이 스스로 학습할 수 없는 외부 설정값들의 최적 조합을 찾아 모델 성능을 극대화하는 프로세스.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** 주어진 데이터와 모델 구조에서 최상의 결과를 내는 매개변수 조합을 탐색(Exploration)과 활용(Exploitation)의 균형을 통해 효율적으로 찾아내는 패턴.
|
||||
- **세부 내용:**
|
||||
- **Grid Search:** 모든 가능한 조합을 격자 형태로 전수 조사. 확실하지만 비용이 매우 높음.
|
||||
- **Random Search:** 파라미터 공간을 무작위로 샘플링. Grid Search보다 효율적임이 증명됨.
|
||||
- **Bayesian Optimization:** 이전 시도의 결과를 바탕으로 확률 모델을 구축하여 유망한 영역을 집중 탐색 (예: Gaussian Processes 활용).
|
||||
- **Hyperband:** 리소스를 적게 할당해 많은 후보를 테스트한 뒤, 유망한 후보에게만 더 많은 리소스를 할당하는 효율적 전략.
|
||||
- **추출된 패턴:** 탐색 공간(Search Space) 내에서 모델의 성능을 평가 지표로 삼아, 가장 효율적인 경로로 최적의 파라미터 조합을 찾아가는 탐색 및 최적화 패턴.
|
||||
- **주요 전략:**
|
||||
- **Grid Search:** 가능한 모든 조합을 시도. 확실하지만 연산 비용이 매우 높음.
|
||||
- **Random Search:** 무작위로 조합을 시도. 그리드 서치보다 효율적이며 중요한 파라미터 탐색에 유리.
|
||||
- **Bayesian Optimization:** 이전 시도 결과를 바탕으로 다음 유망한 지점을 예측하여 탐색 (가장 고도화된 방식).
|
||||
- **Hyperband / BOHB:** 조기 종료(Early Stopping)와 베이지안 최적화를 결합하여 자원을 효율적으로 배분.
|
||||
- **의의:** 동일한 아키텍처라도 하이퍼파라미터 설정에 따라 성능 차이가 크게 발생하므로, 실전 AI 개발에서 '모델링'만큼이나 중요한 단계.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 장인의 '경험'에 의존하던 수동 튜닝에서, 알고리즘이 자동으로 최적값을 찾는 AutoML(Automated Machine Learning) 시대로 전환.
|
||||
- **정책 변화:** Antigravity 에이전트의 내부 모델 튜닝 시, 베이지안 최적화를 기본 알고리즘으로 채택하여 최소한의 시도로 최적의 추론 온도를 결정함.
|
||||
- **과거 데이터와의 충돌:** 개발자의 직관이나 수작업 튜닝에 의존하던 방식에서, 이제는 AutoML 기술을 통해 최적화 과정 자체를 자동화하는 방향으로 진화.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 응답 품질 최적화를 위해 Temperature, Top-p 등의 파라미터를 베이지안 최적화 기반으로 튜닝하여 정교한 페르소나를 구축함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[AutoML]], [[Gaussian-Processes]], [[Machine-Learning-Lifecycle]], [[Deep-Learning]]
|
||||
- [[Black-Box-Optimization]], [[Gaussian-Processes]], [[Global-vs-Local-Optima]], [[Generalization-in-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Hyperparameter-Optimization.md]]
|
||||
|
||||
Reference in New Issue
Block a user