bluemsi/2nd

Files

T

koriweb 3d9d0077cc feat: organize and categorize 1535 knowledge assets into wiki topics (2026-04-29)

2026-04-29 18:14:09 +09:00

2.4 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

ML-NPAR-001

10_Wiki/💡 Topics/AI

1.0

machine-learning

statistics

non-parametric

knn

decision-trees

data-driven

2026-04-26

Non-parametric Models (비모수 모델)

📌 한 줄 통찰 (The Karpathy Summary)

"데이터의 형상을 미리 짐작하여 가두지 말고, 데이터 스스로가 자신의 구조를 드러내게 하라" — 고정된 수의 매개변수를 가지지 않고, 데이터의 규모에 따라 모델의 복잡도가 유연하게 변화하는 머신러닝 알고리즘 체계.

📖 구조화된 지식 (Synthesized Content)

추출된 패턴: "Instance-based and Flexible Representation" — 데이터를 선형이나 정규 분포와 같은 특정 수식으로 요약하는 대신, 데이터 포인트 그 자체를 기억하거나(K-NN) 영역을 잘게 쪼개어(Decision Trees) 복잡하고 불규칙한 데이터의 경계면을 있는 그대로 학습하는 패턴.
주요 특징:
- Flexibility: 데이터의 분포에 대해 강한 가정을 하지 않으므로 매우 유연함.
- Model Complexity: 데이터셋의 크기가 커질수록 필요한 매개변수나 저장 용량도 비례해서 증가함.
- Overfitting Risk: 데이터의 노이즈까지 학습할 위험이 있어 적절한 규제가 필수적임.
의의: 데이터의 패턴이 매우 복잡하거나 사전 지식이 부족한 도메인에서, 고정된 선형 모델보다 훨씬 높은 적응력을 발휘함.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 비모수 모델은 매개변수가 '없다'는 뜻이 아니라, 그 수가 고정되지 않았음을 의미함. 최근에는 가우시안 프로세스(Gaussian Processes)나 베이지안 비모수 모델 등을 통해 불확실성까지 정밀하게 측정하는 방향으로 고도화됨.
정책 변화: Antigravity 프로젝트는 에이전트의 작업 소요 시간 예측이나 이상 탐지(Anomaly Detection) 시, 데이터의 분포를 미리 예단하지 않기 위해 비모수적 접근법인 커널 밀도 추정(KDE)이나 랜덤 포레스트를 적극 활용함.

🔗 지식 연결 (Graph)

K-Nearest-Neighbors-K-NN, Decision-Trees-and-Random-Forests, Support-Vector-Machines-SVM, Instance-based-Learning
Raw Source: 10_Wiki/Topics/AI/Non-parametric-Models.md