--- id: wiki-2026-0508-layer-normalization title: Layer Normalization category: 10_Wiki/Topics status: needs_review canonical_id: self aliases: [DL-NORM-001] duplicate_of: none source_trust_level: A confidence_score: 1.0 tags: [ai, Deep-Learning, Normalization, layer-norm, transformer, Stability] raw_sources: [] last_reinforced: 2026-04-26 github_commit: pending inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08) tech_stack: language: unspecified framework: unspecified --- # Layer Normalization (레이어 정규화) ## 📌 한 줄 통찰 (The Karpathy Summary) > "데이터의 무리를 비교하지 말고, 각 샘플 내부의 통계를 다듬어 모델의 학습을 안정화하라" — 배치 단위가 아닌 각 데이터 샘플(Feature) 단위로 평균과 분산을 계산하여 정규화함으로써, 배치 크기에 구애받지 않고 일관된 학습 성능을 보장하는 기법. ## 📖 구조화된 지식 (Synthesized Content) - **추출된 패턴:** "Intra-sample [[Statistics|Statistics]]" — 배치 정규화(Batch Norm)가 가진 배치 크기 의존성 문제를 해결하기 위해, 하나의 샘플 내 모든 뉴런의 활성화 값을 정규화하여 가중치 초기화나 기울기 소실 문제에 강건하게 대응하는 패턴. - **주요 특징:** - **Batch Independence:** 배치 크기가 1이어도 작동하므로 온라인 학습이나 RNN, Transformer에 최적. - **Computational [[Efficiency|Efficiency]]:** 학습과 추론 시 동일한 방식으로 작동하여 구현이 단순함. - **Stabilizing Deep Nets:** 깊은 신경망의 내부 공변량 변화(Internal Covariate [[Shift|Shift]])를 억제하여 학습 속도 향상. - **의의:** 현대 NLP의 심장인 트랜스포머 아키텍처에서 안정적인 어텐션 연산을 가능케 하는 필수 요소. ## ⚠️ 모순 및 업데이트 (Contradictions & Updates) - **과거 데이터와의 충돌:** 배치 정규화가 모든 곳에서 우월하다는 인식을 깨고, 시퀀스 데이터나 대규모 언어 모델에서는 레이어 정규화가 사실상의 표준(Standard)으로 자리 잡음. - **정책 변화:** Antigravity 프로젝트의 모든 트랜스포머 기반 에이전트 모델은 학습의 안정성과 빠른 수렴을 위해 모든 어텐션 블록 직후에 레이어 정규화 층을 배치함. ## 🔗 지식 연결 (Graph) - [[Transformer-Architecture|Transformer-Architecture]]-Foundations, Deep-Learning-Foundations, Batch-Normalization-Foundations, Weight-Initialization-Strategies - **Raw Source:** 10_Wiki/Topics/AI/Layer-Normalization.md ## 🤖 LLM 활용 힌트 (How to Use This Knowledge) **언제 이 지식을 쓰는가:** - *(TODO)* **언제 쓰면 안 되는가:** - *(TODO)* ## 🧪 검증 상태 (Validation) - **정보 상태:** needs_review - **출처 신뢰도:** A - **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)* ## 🧬 중복 검사 (Duplicate Check) - **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)* - **처리 방식:** UPDATE (자동 정규화) - **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강. ## 🕓 변경 이력 (Changelog) | 날짜 | 변경 내용 | 처리 방식 | 신뢰도 | |------|-----------|-----------|--------| | 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A | ## 💻 코드 패턴 (Code Patterns) **패턴 1:** *(TODO: 이 프로젝트 컨벤션 반영한 구조 스켈레톤)* ```text # TODO ``` ## 🤔 의사결정 기준 (Decision Criteria) **선택 A를 써야 할 때:** - *(TODO)* **선택 B를 써야 할 때:** - *(TODO)* **기본값:** > *(TODO)* ## ❌ 안티패턴 (Anti-Patterns) - **[안티패턴]:** *(TODO: 무엇을 하면 안 되는가 + 이유 + 대신 무엇을)*