Files
2nd/10_Wiki/Topics/AI/Hyperparameter-Optimization.md
T
2026-04-30 22:42:02 +09:00

2.3 KiB


id: OPT-HYPER-001 category: "10_Wiki/💡 Topics/AI" confidence_score: 1.0 tags: [ai, machine-learning, hyperParameter-tuning, bayesian-Optimization, model-selection] last_reinforced: 2026-04-26

Hyperparameter Optimization (하이퍼파라미터 최적화)

📌 한 줄 통찰 (The Karpathy Summary)

"모델 아키텍처가 악기라면, 하이퍼파라미터 최적화는 가장 아름다운 소리를 내기 위해 현을 조율하는 과정이다" — 학습률, 배치 크기, 레이어 수 등 모델이 스스로 학습할 수 없는 외부 설정값들의 최적 조합을 찾아 모델 성능을 극대화하는 프로세스.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: 탐색 공간(Search Space) 내에서 모델의 성능을 평가 지표로 삼아, 가장 효율적인 경로로 최적의 파라미터 조합을 찾아가는 탐색 및 최적화 패턴.
  • 주요 전략:
    • Grid Search: 가능한 모든 조합을 시도. 확실하지만 연산 비용이 매우 높음.
    • Random Search: 무작위로 조합을 시도. 그리드 서치보다 효율적이며 중요한 파라미터 탐색에 유리.
    • Bayesian Optimization: 이전 시도 결과를 바탕으로 다음 유망한 지점을 예측하여 탐색 (가장 고도화된 방식).
    • Hyperband / BOHB: 조기 종료(Early Stopping)와 베이지안 최적화를 결합하여 자원을 효율적으로 배분.
  • 의의: 동일한 아키텍처라도 하이퍼파라미터 설정에 따라 성능 차이가 크게 발생하므로, 실전 AI 개발에서 '모델링'만큼이나 중요한 단계.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 개발자의 직관이나 수작업 튜닝에 의존하던 방식에서, 이제는 AutoML 기술을 통해 최적화 과정 자체를 자동화하는 방향으로 진화.
  • 정책 변화: Antigravity 프로젝트는 에이전트의 응답 품질 최적화를 위해 Temperature, Top-p 등의 파라미터를 베이지안 최적화 기반으로 튜닝하여 정교한 페르소나를 구축함.

🔗 지식 연결 (Graph)