bluemsi/2nd

Files

T

bluemsi ae1627c35b feat: achieve 600 files milestone in AI knowledge base

2026-04-20 19:23:51 +09:00

1.7 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AI-HYPERPARAM

10_Wiki/💡 Topics/AI

0.96

AI

MachineLearning

Hyperparameter

Optimization

2026-04-20

Hyperparameter-Optimization (하이퍼파라미터 최적화)

📌 한 줄 통찰 (The Karpathy Summary)

"학습을 배우는 기술, 모델의 성격을 튜닝하는 과정." 모델이 스스로 학습하는 가중치(Weight)가 아니라, 학습 방식 자체를 결정하는 설정값(배치 크기, 학습률 등)의 최적 조합을 찾는 과정이다.

📖 구조화된 지식 (Synthesized Content)

Key Parameters:
- Learning Rate: 가중치 업데이트의 크기.
- Batch Size: 한 번에 학습할 데이터 뭉치의 크기.
- Number of Layers/Neurons: 신경망의 구조적 크기.
Methods:
- Grid Search: 모든 조합을 격자무늬로 다 시도함 (느림).
- Random Search: 무작위로 조합을 골라 시도함 (은근히 효과적).
- Bayesian Optimization: 이전 시도 결과를 바탕으로 유망한 조합을 예측하며 탐색 (Gausean Process 등 활용).
Goal: 검증 데이터(Validation set)에 대해 최고의 성능을 내는 설정을 확보하는 것.

⚠️ 모순 및 업데이트 (RL Update)

하이퍼파라미터 튜닝 자체에 너무 많은 컴퓨팅 자원을 쓰는 것은 '주객전도'가 될 수 있다. 최근에는 AutoML이나 Population Based Training (PBT) 등을 통해 학습 중간에 실시간으로 하이퍼파라미터를 진화시키는 방식이 대형 모델 학습에서 표준으로 쓰이고 있다.

🔗 지식 연결 (Graph)

Related: Gradient-Descent , AutoML
Concept: Overfitting-vs-Underfitting