---
id: ML-REG-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [machine-learning, regularization, l1-norm, l2-norm, overfitting, optimization]
last_reinforced: 2026-04-26
---

# L1 and L2 Regularization (L1 및 L2 정규화)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "모델의 욕심(Weight)에 벌점을 부여하여, 단순함의 미학으로 과적합(Overfitting)의 늪을 탈출하라" — 손실 함수에 가중치의 크기를 페널티로 추가하여, 모델이 특정 데이터에만 과도하게 맞춰지는 것을 방지하고 일반화 성능을 높이는 기법.

## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Weight Decay" — 가중치가 커질수록 전체 손실(Loss)을 증가시켜, 모델이 가능한 작은 가중치 값을 갖도록 유도함으로써 복잡도를 제어하는 수치적 억제 패턴.
- **주요 유형:**
    - **L1 Regularization (Lasso):** 가중치의 절대값 합을 페널티로 부여. 중요하지 않은 가중치를 0으로 만들어 특징 선택(Feature Selection) 효과 발생.
    - **L2 Regularization (Ridge):** 가중치의 제곱 합을 페널티로 부여. 가중치를 전반적으로 작고 고르게 만들어 급격한 변화를 억제.
- **의의:** 고차원 데이터에서 모델이 노이즈까지 학습하는 것을 방지하여, 실전에서 안정적인 예측 성능을 보장함.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 가중치를 줄이는 것만이 능사가 아니며, 데이터의 특성에 따라 L1과 L2를 결합한 Elastic Net이나 드롭아웃(Dropout) 등과 병행하여 최적의 균형점을 찾는 것이 현대 딥러닝의 표준.
- **정책 변화:** Antigravity 프로젝트의 핵심 추론 모델들은 학습 시 과도한 가중치 쏠림을 방지하기 위해 L2 정규화를 기본 적용하며, 희소한 지식 특징을 추출해야 하는 모듈에는 L1 정규화를 전략적으로 사용함.

## 🔗 지식 연결 (Graph)
- [[Supervised-Learning-Foundations|Supervised-Learning-Foundations]], [[Generalization-in-AI|Generalization-in-AI]], [[Hyperparameter-Optimization|Hyperparameter-Optimization]], [[Loss-Functions-Foundations|Loss-Functions-Foundations]]
- **Raw Source:** 10_Wiki/Topics/AI/L1-and-L2-Regularization.md