2nd/10_Wiki/Topics/AI/Hyperparameter-Optimization.md

---
id: P-REINFORCE-AI-HYPERPARAM
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.96
tags: [AI, MachineLearning, Hyperparameter, Optimization]
last_reinforced: 2026-04-20
---

# [[Hyperparameter-Optimization]] (하이퍼파라미터 최적화)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "학습을 배우는 기술, 모델의 성격을 튜닝하는 과정." 모델이 스스로 학습하는 가중치(Weight)가 아니라, 학습 방식 자체를 결정하는 설정값(배치 크기, 학습률 등)의 최적 조합을 찾는 과정이다.

## 📖 구조화된 지식 (Synthesized Content)
- **Key Parameters**:
    - **Learning Rate**: 가중치 업데이트의 크기.
    - **Batch Size**: 한 번에 학습할 데이터 뭉치의 크기.
    - **Number of Layers/Neurons**: 신경망의 구조적 크기.
- **Methods**:
    - **Grid Search**: 모든 조합을 격자무늬로 다 시도함 (느림).
    - **Random Search**: 무작위로 조합을 골라 시도함 (은근히 효과적).
    - **Bayesian Optimization**: 이전 시도 결과를 바탕으로 유망한 조합을 예측하며 탐색 (Gausean Process 등 활용).
- **Goal**: 검증 데이터(Validation set)에 대해 최고의 성능을 내는 설정을 확보하는 것.

## ⚠️ 모순 및 업데이트 (RL Update)
- 하이퍼파라미터 튜닝 자체에 너무 많은 컴퓨팅 자원을 쓰는 것은 '주객전도'가 될 수 있다. 최근에는 **AutoML**이나 **Population Based Training (PBT)** 등을 통해 학습 중간에 실시간으로 하이퍼파라미터를 진화시키는 방식이 대형 모델 학습에서 표준으로 쓰이고 있다.

## 🔗 지식 연결 (Graph)
- Related: [[Gradient-Descent]] , [[AutoML]]
- Concept: [[Overfitting-vs-Underfitting]]