[G1-Sync] Manual knowledge update

2026-05-10 22:08:15 +09:00
parent 21ac3ed255
commit 504fd5fb42
3011 changed files with 380280 additions and 206977 deletions
@@ -1,89 +1,174 @@
 ---
 id: wiki-2026-0508-neural-architecture-search-nas
-title: Neural Architecture Search NAS
-category: 10_Wiki/Topics
-status: needs_review
-canonical_id: self
-aliases: [AI-NAS-001]
+title: Neural Architecture Search (NAS)
+status: verified
+canonical_id: wiki-2026-0508-neural-architecture-search-nas
+aliases: [NAS, AutoML-NAS, Architecture Search]
 duplicate_of: none
 source_trust_level: A
-confidence_score: 1.0
-tags: [ai, Deep-Learning, nas, automl, Neural-Architecture-Search, Optimization]
+confidence_score: 0.9
+verification_status: applied
+tags: [automl, nas, deep-learning, architecture, optimization]
 raw_sources: []
-last_reinforced: 2026-04-26
+last_reinforced: 2026-05-10
 github_commit: pending
-inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
-tech_stack:
-  language: unspecified
-  framework: unspecified
+tech_stack: [python, pytorch, nni, autokeras]
 ---

-# Neural Architecture [[Search|Search]] (NAS, 신경망 구조 탐색)
+# Neural Architecture Search (NAS)

-## 📌 한 줄 통찰 (The Karpathy Summary)
-> "인간의 직관에 의존하던 모델 설계를 알고리즘적 탐색으로 전환하여, 데이터에 가장 완벽하게 부합하는 '지능의 형상'을 스스로 창조하라" — 수많은 가능한 신경망 구조 중 성능과 효율성이 가장 뛰어난 아키텍처를 자동으로 찾아내는 AutoML의 핵심 분야.
+## 한 줄 정의

-## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Automated Structural Optimization" — 탐색 공간(Search Space)을 정의하고, 강화학습이나 유전 알고리즘과 같은 탐색 전략을 통해 후보 아키텍처를 생성한 뒤, 그 성능을 예측하여 최적의 구조를 반복적으로 찾아가는 패턴.
- **3대 핵심 요소:**
-    - **Search Space:** 어떤 층을 쌓을지, 어떻게 연결할지에 대한 후보 범위 정의.
-    - **Search [[Strategy|Strategy]]:** 무작위 탐색, 강화학습, 베이지안 최적화 등 최적 구조를 찾아가는 전략.
-    - **Performance Estimation:** 생성된 구조를 실제로 다 학습시키지 않고도 성능을 빠르게 예측하는 기술.
- **의의:** 인간이 설계한 모델(Inception, ResNet 등)을 뛰어넘는 고성능 모델(EfficientNet, MnasNet 등)을 탄생시켰으며, 특정 하드웨어에 최적화된 맞춤형 AI 모델 구축을 가능케 함.
+신경망 **아키텍처 자체를 자동 탐색**해 정확도·지연시간·파라미터 같은 목적함수를 최적화하는 AutoML 분야. 2017–2020년 비전 분야 SOTA를 갱신했지만, 2022+ Transformer/Foundation 모델 표준화 이후 **연구 활성도는 감소**, 현재는 edge·MoE·LLM 변형 설계 등 특정 영역에 잔존한다.

-## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
- **과거 데이터와의 충돌:** 엄청난 컴퓨팅 자원이 소모된다는 초기 비판을 넘어, 이제는 미분 가능한 탐색 공간(D[[Arts|Arts]])이나 한 번의 학습으로 여러 구조를 평가하는 One-shot NAS 등을 통해 연산 비용을 획기적으로 낮춘 실용적 단계에 도달함.
- **정책 변화:** Antigravity 프로젝트는 특정 엣지 기기용 소형 브레인을 설계할 때, 해당 하드웨어의 지연 시간과 메모리 제약을 준수하면서 정확도를 극대화하는 NAS 기반의 모델 커스터마이징을 수행함.
+## 핵심

-## 🔗 지식 연결 (Graph)
- HyperParameter-Optimization, Deep-Learning-Foundations, [[Reinforcement-Learning|Reinforcement-Learning]], [[Mobile-AI-Optimization|Mobile-AI-Optimization]]
- **Raw Source:** 10_Wiki/Topics/AI/Neural-Architecture-Search-NAS.md
+### 3대 구성요소 (Elsken 2019 정리)

-## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
+1. **Search space**: 후보 연산(conv 3×3, depthwise, identity 등)과 토폴로지.
+2. **Search strategy**: RL, evolution, gradient(DARTS), Bayesian.
+3. **Performance estimation**: 짧은 학습, weight sharing, predictor.

-**언제 이 지식을 쓰는가:**
- *(TODO)*
+### 대표 방법

-**언제 쓰면 안 되는가:**
- *(TODO)*
+- **NASNet (2017)**: RL controller로 cell 검색. GPU 수천 일 필요.
+- **ENAS (2018)**: parameter sharing → 1 GPU 일.
+- **DARTS (2019)**: 연속 완화 + gradient. **NAS 대중화의 분기점**.
+- **ProxylessNAS (2019)**: 타겟 hardware latency 직접 최적화.
+- **Once-for-All (2020)**: 한 번 학습 → 다양한 sub-network 추출 (edge).
+- **EfficientNet 계열**: NAS+compound scaling.
+- **Zero-cost NAS (2021+)**: 학습 없이 proxy score (synflow, jacov).

-## 🧪 검증 상태 (Validation)
+### 2024–2026 현황

- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
+- 비전: ConvNeXt/MAE 등 hand-design + 사전학습이 주류.
+- LLM: 사실상 dense Transformer 표준 → NAS는 **MoE routing, KV cache 구조, 효율 attention** 등 부분 검색에 한정.
+- **Edge / NPU**: TFLite/CoreML 타겟 latency-aware NAS는 여전히 유용.
+- **AutoML 도구화**: AutoKeras, NNI, Vertex AI Neural Architecture Search.

-## 🧬 중복 검사 (Duplicate Check)
+### 응용

- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
+모바일 비전 모델(MobileNetV3, EfficientNet-Lite), 의료 영상 백본 검색, NPU 최적화, 작은 LLM 변형 (헤드 수·차원 검색).

-## 🕓 변경 이력 (Changelog)
+## 💻 패턴

-| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
-|------|-----------|-----------|--------|
-| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
+### Search space 정의 (간이 cell)

-## 💻 코드 패턴 (Code Patterns)
+```python
+OPS = ["conv3x3", "conv5x5", "dwconv3x3", "max_pool3x3", "identity", "skip"]

-**패턴 1:** *(TODO: 이 프로젝트 컨벤션 반영한 구조 스켈레톤)*
-
-```text
-# TODO
+def sample_cell(n_nodes=4):
+    return [(prev_idx, op) for prev_idx in range(n_nodes)
+                            for op in [random.choice(OPS)]]
 ```

-## 🤔 의사결정 기준 (Decision Criteria)
+### DARTS — α 학습 (개념 코드)

-**선택 A를 써야 할 때:**
- *(TODO)*
+```python
+class MixedOp(nn.Module):
+    def __init__(self, C):
+        super().__init__()
+        self.ops = nn.ModuleList([build_op(o, C) for o in OPS])
+        self.alpha = nn.Parameter(torch.zeros(len(OPS)))

-**선택 B를 써야 할 때:**
- *(TODO)*
+    def forward(self, x):
+        w = F.softmax(self.alpha, dim=-1)
+        return sum(w[i] * op(x) for i, op in enumerate(self.ops))

-**기본값:**
-> *(TODO)*
+# 1차 근사 학습 루프
+for x_t, y_t, x_v, y_v in loader_pair:
+    loss_w = ce(model(x_t), y_t); loss_w.backward(); opt_w.step(); opt_w.zero_grad()
+    loss_a = ce(model(x_v), y_v); loss_a.backward(); opt_a.step(); opt_a.zero_grad()

-## ❌ 안티패턴 (Anti-Patterns)
+best_op_per_edge = [OPS[m.alpha.argmax().item()] for m in mixed_ops]
+```

- **[안티패턴]:** *(TODO: 무엇을 하면 안 되는가 + 이유 + 대신 무엇을)*
+### Evolutionary search (간단)
+
+```python
+def evolve(pop, fitness, gens=20, k=5):
+    for _ in range(gens):
+        scored = sorted(pop, key=fitness, reverse=True)
+        parents = scored[:k]
+        children = [mutate(random.choice(parents)) for _ in range(len(pop)-k)]
+        pop = parents + children
+    return scored[0]
+```
+
+### Hardware-aware loss (ProxylessNAS 류)
+
+```python
+loss = ce(logits, y) + lam * predicted_latency(arch_params)
+```
+
+### Zero-cost proxy (synflow)
+
+```python
+def synflow(model, x):
+    for p in model.parameters():
+        p.data = p.data.abs()
+    out = model(x).sum()
+    out.backward()
+    score = sum((p * p.grad).sum().item() for p in model.parameters() if p.grad is not None)
+    return score
+```
+
+### NNI 사용 예 (현실적 default)
+
+```python
+# search_space.json 정의 후
+import nni
+from nni.experiment import Experiment
+exp = Experiment("local")
+exp.config.search_space = json.load(open("search_space.json"))
+exp.config.trial_command = "python train.py"
+exp.config.trial_concurrency = 4
+exp.config.tuner.name = "TPE"
+exp.run(8080)
+```
+
+## 결정 기준
+
+| 상황 | 추천 |
+|---|---|
+| compute 풍부, 연구용 | DARTS / Evolutionary |
+| 작은 GPU 1대 | DARTS / ENAS |
+| Edge / mobile latency 목표 | **ProxylessNAS, Once-for-All** |
+| 빠른 baseline | hand-design + 사전학습 (EfficientNet, ConvNeXt) |
+| LLM 사전학습 | NAS 비추 — 표준 Transformer 사용 |
+| 빠른 평가 | Zero-cost proxy + top-k 재학습 |
+| 실서비스 자동화 | NNI / Vertex NAS |
+
+기본값: **사전학습 backbone 사용**. NAS는 **edge latency 제약** 또는 **search space가 도메인-specific** 일 때 검토.
+
+## 🔗 Graph
+
+- 부모: [[AutoML]] · [[Deep-Learning]] · [[Hyperparameter-Optimization]]
+- 변형: [[DARTS]] · [[ProxylessNAS]] · [[Once-for-All]] · [[Zero-Cost-NAS]]
+- 응용: [[EfficientNet]] · [[MobileNet]] · [[Edge-AI]] · [[NPU-Optimization]]
+- Adjacent: [[Mixture-of-Experts]] · [[Knowledge-Distillation]] · [[Pruning]] · [[Quantization]]
+
+## 🤖 LLM 활용
+
+**언제**: search space 설계 brainstorm, DARTS α 해석 sanity check, 논문 비교 요약, NNI/AutoKeras config 작성.
+
+**언제 X**: 실제 NAS 결과를 LLM 직관으로 대체 — 최종 아키텍처는 검증 데이터로 측정 필요. compute 비용 추정도 실측 우선.
+
+## ❌ 안티패턴
+
+- DARTS의 weight sharing 편향(skip connection 폭주) 무시.
+- 검증셋이 search 와 final 학습에 모두 노출 → 결과 과대평가.
+- 단일 GPU·짧은 epoch 추정으로 최종 성능 결정 — 재학습 필수.
+- 하드웨어 latency 측정 없이 "FLOPs만" 최적화 → 실기기 속도와 괴리.
+- 2026년에 LLM 사전학습용 NAS 시도 — 비용·표준화 문제로 ROI 낮음.
+
+## 🧪 검증 / 중복
+
+Verified source: Elsken et al. *NAS Survey* (2019), Liu et al. *DARTS* (2019), Cai et al. *ProxylessNAS / OFA*, Microsoft NNI 문서, Google Vertex AI NAS docs, recent zero-cost NAS surveys (2022–2024). 신뢰도 A.
+
+중복 없음. [[AutoML]] 은 부모, [[Hyperparameter-Optimization]] 은 형제 개념.
+
+## 🕓 Changelog
+
+- 2026-05-08 Phase 1 — 초기 stub.
+- 2026-05-10 Manual cleanup — FULL canonical 재작성. DARTS/ProxylessNAS/OFA/zero-cost 코드 6개, 2024–2026 현황(사용 빈도 감소) 반영.