Files
2nd/10_Wiki/Topics/AI_and_ML/Non-parametric-Models.md
T

89 lines
4.0 KiB
Markdown

---
id: wiki-2026-0508-non-parametric-models
title: Non parametric Models
category: 10_Wiki/Topics
status: needs_review
canonical_id: self
aliases: [ML-NPAR-001]
duplicate_of: none
source_trust_level: A
confidence_score: 1.0
tags: [machine-learning, Statistics, non-parametric, knn, decision-trees, data-driven]
raw_sources: []
last_reinforced: 2026-04-26
github_commit: pending
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
tech_stack:
language: unspecified
framework: unspecified
---
# Non-parametric Models (비모수 모델)
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 형상을 미리 짐작하여 가두지 말고, 데이터 스스로가 자신의 구조를 드러내게 하라" — 고정된 수의 매개변수를 가지지 않고, 데이터의 규모에 따라 모델의 복잡도가 유연하게 변화하는 머신러닝 알고리즘 체계.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Instance-based and Flexible Representation" — 데이터를 선형이나 정규 분포와 같은 특정 수식으로 요약하는 대신, 데이터 포인트 그 자체를 기억하거나(K-NN) 영역을 잘게 쪼개어([[Decision Tree|Decision Tree]]s) 복잡하고 불규칙한 데이터의 경계면을 있는 그대로 학습하는 패턴.
- **주요 특징:**
- **Flexibility:** 데이터의 분포에 대해 강한 가정을 하지 않으므로 매우 유연함.
- **Model Complexity:** 데이터셋의 크기가 커질수록 필요한 매개변수나 저장 용량도 비례해서 증가함.
- **[[Overfitting|Overfitting]] Risk:** 데이터의 노이즈까지 학습할 위험이 있어 적절한 규제가 필수적임.
- **의의:** 데이터의 패턴이 매우 복잡하거나 사전 지식이 부족한 도메인에서, 고정된 선형 모델보다 훨씬 높은 적응력을 발휘함.
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
- **과거 데이터와의 충돌:** 비모수 모델은 매개변수가 '없다'는 뜻이 아니라, 그 수가 고정되지 않았음을 의미함. 최근에는 가우시안 프로세스(Gaussian Processes)나 베이지안 비모수 모델 등을 통해 불확실성까지 정밀하게 측정하는 방향으로 고도화됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 소요 시간 예측이나 이상 탐지(Anomaly Detection) 시, 데이터의 분포를 미리 예단하지 않기 위해 비모수적 접근법인 커널 밀도 추정(KDE)이나 랜덤 포레스트를 적극 활용함.
## 🔗 지식 연결 (Graph)
- [[K-Nearest-Neighbors-K-NN|K-Nearest-Neighbors-K-NN]], Decision-Trees-and-Random-Forests, [[Support-Vector-Machines|Support-Vector-Machines]]-SVM, [[Instance-based-Learning|Instance-based-Learning]]
- **Raw Source:** 10_Wiki/Topics/AI/Non-parametric-Models.md
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
**언제 이 지식을 쓰는가:**
- *(TODO)*
**언제 쓰면 안 되는가:**
- *(TODO)*
## 🧪 검증 상태 (Validation)
- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
## 🧬 중복 검사 (Duplicate Check)
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
## 🕓 변경 이력 (Changelog)
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|------|-----------|-----------|--------|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
## 💻 코드 패턴 (Code Patterns)
**패턴 1:** *(TODO: 이 프로젝트 컨벤션 반영한 구조 스켈레톤)*
```text
# TODO
```
## 🤔 의사결정 기준 (Decision Criteria)
**선택 A를 써야 할 때:**
- *(TODO)*
**선택 B를 써야 할 때:**
- *(TODO)*
**기본값:**
> *(TODO)*
## ❌ 안티패턴 (Anti-Patterns)
- **[안티패턴]:** *(TODO: 무엇을 하면 안 되는가 + 이유 + 대신 무엇을)*