30 lines
2.5 KiB
Markdown
30 lines
2.5 KiB
Markdown
---
|
|
id: AI-OPT-REG-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 1.0
|
|
tags: [ai, deep-learning, regularization, overfitting, l1-lasso, l2-ridge, dropout, early-stopping]
|
|
last_reinforced: 2026-04-26
|
|
---
|
|
|
|
# Regularization Strategies (규제 전략)
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "모델의 지능이 특정 데이터에만 매몰되지 않도록 가중치에 '벌금'을 매기거나 구조적 '결핍'을 부여하여, 어떤 상황에서도 유연하게 대응하는 일반화 능력을 확보하라" — 학습 오차를 줄이는 것과 모델의 복잡도를 낮추는 것 사이의 균형을 맞추어 과적합(Overfitting)을 방지하는 기술적 수단들.
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
- **추출된 패턴:** "Complexity Penalty and Stochastic Variation" — 손실 함수에 모델 크기에 비례하는 항을 추가하거나(L1/L2), 학습 시 무작위성을 주입하여(Dropout) 특정 경로에만 의존하지 않게 함으로써 모델의 강건성(Robustness)을 높이는 패턴.
|
|
- **주요 전략:**
|
|
- **L1 (Lasso):** 중요하지 않은 가중치를 0으로 만들어 변수 선택 효과 제공.
|
|
- **L2 (Ridge):** 가중치들을 전반적으로 작게 유지하여 급격한 변화 억제.
|
|
- **Dropout:** 학습 시 뉴런을 무작위로 생략하여 특정 뉴런에의 의존도 감소.
|
|
- **Early Stopping:** 검증 오차가 오르기 시작하는 시점에 학습을 중단.
|
|
- **의의:** AI 모델이 훈련 데이터의 노이즈까지 외워버리는 부작용을 막고, 본질적인 패턴만을 학습하게 유도하는 '최적화의 윤리'와 같은 역할.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌:** 규제가 강할수록 정확도가 떨어진다는 우려는 이제 '검증 데이터'에 대한 일반화 성능 향상으로 상쇄되며, 현대 딥러닝에서는 드롭아웃과 배치 정규화(Batch Norm)를 함께 사용하는 것이 사실상의 표준 아키텍처가 됨.
|
|
- **정책 변화:** Antigravity 프로젝트는 에이전트의 미세 조정 시, 소량의 데이터로도 범용적인 성능을 유지하기 위해 가중치 감쇠(Weight Decay)와 조기 종료 프로토콜을 필수적으로 가동함.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Overfitting-and-Underfitting|Overfitting-and-Underfitting]], [[Optimization-in-AI|Optimization-in-AI]], [[Normalization-Strategies|Normalization-Strategies]], [[Performance-Metrics-in-AI|Performance-Metrics-in-AI]]
|
|
- **Raw Source:** 10_Wiki/Topics/AI/Regularization-Strategies.md
|