Files
2nd/10_Wiki/Topics_Dev/Regularization-Strategies.md
T

2.6 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
AI-OPT-REG-001 Dev 1.0
ai
Deep-Learning|Deep-Learning
Regularization|Regularization
Overfitting|Overfitting
l1-lasso
l2-ridge
dropout
early-stopping
2026-04-26

Regularization Strategies (규제 전략)

📌 한 줄 통찰 (The Karpathy Summary)

"모델의 지능이 특정 데이터에만 매몰되지 않도록 가중치에 '벌금'을 매기거나 구조적 '결핍'을 부여하여, 어떤 상황에서도 유연하게 대응하는 일반화 능력을 확보하라" — 학습 오차를 줄이는 것과 모델의 복잡도를 낮추는 것 사이의 균형을 맞추어 과적합(Overfitting)을 방지하는 기술적 수단들.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: "Complexity Penalty and Stochastic Variation" — 손실 함수에 모델 크기에 비례하는 항을 추가하거나(L1/L2), 학습 시 무작위성을 주입하여(Dropout) 특정 경로에만 의존하지 않게 함으로써 모델의 강건성(Robustness)을 높이는 패턴.
  • 주요 전략:
    • L1 (Lasso): 중요하지 않은 가중치를 0으로 만들어 변수 선택 효과 제공.
    • L2 (Ridge): 가중치들을 전반적으로 작게 유지하여 급격한 변화 억제.
    • Dropout: 학습 시 뉴런을 무작위로 생략하여 특정 뉴런에의 의존도 감소.
    • Early Stopping: 검증 오차가 오르기 시작하는 시점에 학습을 중단.
  • 의의: AI 모델이 훈련 데이터의 노이즈까지 외워버리는 부작용을 막고, 본질적인 패턴만을 학습하게 유도하는 '최적화의 윤리'와 같은 역할.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 규제가 강할수록 정확도가 떨어진다는 우려는 이제 '검증 데이터'에 대한 일반화 성능 향상으로 상쇄되며, 현대 딥러닝에서는 드롭아웃과 배치 정규화(Batch Norm)를 함께 사용하는 것이 사실상의 표준 아키텍처가 됨.
  • 정책 변화: Antigravity 프로젝트는 에이전트의 미세 조정 시, 소량의 데이터로도 범용적인 성능을 유지하기 위해 가중치 감쇠(Weight Decay)와 조기 종료 프로토콜을 필수적으로 가동함.

🔗 지식 연결 (Graph)