bluemsi/2nd

Files

T

bluemsi 6b86b0da4c feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup

2026-04-27 18:58:22 +09:00

2.2 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

ML-REG-001

10_Wiki/💡 Topics/AI

1.0

machine-learning

regularization

l1-norm

l2-norm

overfitting

optimization

2026-04-26

L1 and L2 Regularization (L1 및 L2 정규화)

📌 한 줄 통찰 (The Karpathy Summary)

"모델의 욕심(Weight)에 벌점을 부여하여, 단순함의 미학으로 과적합(Overfitting)의 늪을 탈출하라" — 손실 함수에 가중치의 크기를 페널티로 추가하여, 모델이 특정 데이터에만 과도하게 맞춰지는 것을 방지하고 일반화 성능을 높이는 기법.

📖 구조화된 지식 (Synthesized Content)

추출된 패턴: "Weight Decay" — 가중치가 커질수록 전체 손실(Loss)을 증가시켜, 모델이 가능한 작은 가중치 값을 갖도록 유도함으로써 복잡도를 제어하는 수치적 억제 패턴.
주요 유형:
- L1 Regularization (Lasso): 가중치의 절대값 합을 페널티로 부여. 중요하지 않은 가중치를 0으로 만들어 특징 선택(Feature Selection) 효과 발생.
- L2 Regularization (Ridge): 가중치의 제곱 합을 페널티로 부여. 가중치를 전반적으로 작고 고르게 만들어 급격한 변화를 억제.
의의: 고차원 데이터에서 모델이 노이즈까지 학습하는 것을 방지하여, 실전에서 안정적인 예측 성능을 보장함.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 단순히 가중치를 줄이는 것만이 능사가 아니며, 데이터의 특성에 따라 L1과 L2를 결합한 Elastic Net이나 드롭아웃(Dropout) 등과 병행하여 최적의 균형점을 찾는 것이 현대 딥러닝의 표준.
정책 변화: Antigravity 프로젝트의 핵심 추론 모델들은 학습 시 과도한 가중치 쏠림을 방지하기 위해 L2 정규화를 기본 적용하며, 희소한 지식 특징을 추출해야 하는 모듈에는 L1 정규화를 전략적으로 사용함.

🔗 지식 연결 (Graph)

Supervised-Learning-Foundations, Generalization-in-AI, Hyperparameter-Optimization, Loss-Functions-Foundations
Raw Source: 10_Wiki/Topics/AI/L1-and-L2-Regularization.md