Files
2nd/10_Wiki/Topics/AI/Hyperparameter-Optimization.md
T

2.0 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
HYPER-OPT-001 10_Wiki/💡 Topics/AI 1.0
machine-learning
optimization
automl
deep-learning
2026-04-26

Hyperparameter Optimization (하이퍼파라미터 최적화)

📌 한 줄 통찰 (The Karpathy Summary)

"모델의 성능을 결정짓는 '튜닝 레버'들의 최적 조합을 찾아라" — 학습률, 배치 크기, 레이어 수 등 학습 과정에서 자동으로 학습되지 않는 설정값(Hyperparameters)들을 체계적으로 탐색하여 성능을 극대화하는 과정.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: 주어진 데이터와 모델 구조에서 최상의 결과를 내는 매개변수 조합을 탐색(Exploration)과 활용(Exploitation)의 균형을 통해 효율적으로 찾아내는 패턴.
  • 세부 내용:
    • Grid Search: 모든 가능한 조합을 격자 형태로 전수 조사. 확실하지만 비용이 매우 높음.
    • Random Search: 파라미터 공간을 무작위로 샘플링. Grid Search보다 효율적임이 증명됨.
    • Bayesian Optimization: 이전 시도의 결과를 바탕으로 확률 모델을 구축하여 유망한 영역을 집중 탐색 (예: Gaussian Processes 활용).
    • Hyperband: 리소스를 적게 할당해 많은 후보를 테스트한 뒤, 유망한 후보에게만 더 많은 리소스를 할당하는 효율적 전략.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 장인의 '경험'에 의존하던 수동 튜닝에서, 알고리즘이 자동으로 최적값을 찾는 AutoML(Automated Machine Learning) 시대로 전환.
  • 정책 변화: Antigravity 에이전트의 내부 모델 튜닝 시, 베이지안 최적화를 기본 알고리즘으로 채택하여 최소한의 시도로 최적의 추론 온도를 결정함.

🔗 지식 연결 (Graph)