Files
2nd/10_Wiki/Topics/AI/Hyperparameter-Optimization.md
T

1.7 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AI-HYPERPARAM 10_Wiki/💡 Topics/AI 0.96
AI
MachineLearning
Hyperparameter
Optimization
2026-04-20

Hyperparameter-Optimization (하이퍼파라미터 최적화)

📌 한 줄 통찰 (The Karpathy Summary)

"학습을 배우는 기술, 모델의 성격을 튜닝하는 과정." 모델이 스스로 학습하는 가중치(Weight)가 아니라, 학습 방식 자체를 결정하는 설정값(배치 크기, 학습률 등)의 최적 조합을 찾는 과정이다.

📖 구조화된 지식 (Synthesized Content)

  • Key Parameters:
    • Learning Rate: 가중치 업데이트의 크기.
    • Batch Size: 한 번에 학습할 데이터 뭉치의 크기.
    • Number of Layers/Neurons: 신경망의 구조적 크기.
  • Methods:
    • Grid Search: 모든 조합을 격자무늬로 다 시도함 (느림).
    • Random Search: 무작위로 조합을 골라 시도함 (은근히 효과적).
    • Bayesian Optimization: 이전 시도 결과를 바탕으로 유망한 조합을 예측하며 탐색 (Gausean Process 등 활용).
  • Goal: 검증 데이터(Validation set)에 대해 최고의 성능을 내는 설정을 확보하는 것.

⚠️ 모순 및 업데이트 (RL Update)

  • 하이퍼파라미터 튜닝 자체에 너무 많은 컴퓨팅 자원을 쓰는 것은 '주객전도'가 될 수 있다. 최근에는 AutoML이나 Population Based Training (PBT) 등을 통해 학습 중간에 실시간으로 하이퍼파라미터를 진화시키는 방식이 대형 모델 학습에서 표준으로 쓰이고 있다.

🔗 지식 연결 (Graph)