31 lines
2.4 KiB
Markdown
31 lines
2.4 KiB
Markdown
---
|
|
id: ML-INST-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 1.0
|
|
tags: [machine-learning, instance-based-learning, knn, lazy-learning, similarity-metrics]
|
|
last_reinforced: 2026-04-26
|
|
---
|
|
|
|
# Instance-based Learning (사례 기반 학습)
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "복잡한 수식을 만들지 말고, 가장 닮은 과거의 이웃에게 길을 물어 답을 찾아라" — 별도의 학습 과정 없이 훈련 데이터를 그대로 저장해 두었다가, 새로운 데이터가 유입될 때마다 유사도 측정을 통해 가장 가까운 사례들의 정답을 인용하는 머신러닝 방식.
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
- **추출된 패턴:** "Lazy Learning" — 추상적인 모델을 구축하는 비용을 아끼는 대신, 추론 시점에 모든 연산을 집중하여 실시간으로 데이터 간의 거리를 계산하는 지연 추론 패턴.
|
|
- **핵심 알고리즘:**
|
|
- **k-Nearest Neighbors (k-NN):** 가장 가까운 k개의 이웃을 찾아 다수결이나 평균으로 예측.
|
|
- **Case-Based Reasoning (CBR):** 과거의 성공 사례를 검색하고, 현재 문제에 맞게 수정하여 적용.
|
|
- **장점 및 단점:**
|
|
- **장점:** 데이터가 추가될 때 재학습이 필요 없음. 국지적(Local) 특징 반영에 강함.
|
|
- **단점:** 데이터가 많아질수록 추론 속도가 급격히 느려짐(연산 부하). 노이즈에 취약함.
|
|
- **의의:** 추천 시스템(Collaborative Filtering)이나 이상 징후 탐지 등 데이터의 유사성이 판단의 핵심인 분야에서 널리 활용됨.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌:** 연산 성능의 한계로 소규모 데이터에만 쓰이던 방식이, 이제는 벡터 데이터베이스와 고성능 인덱싱 기술(HNSW 등)의 발전으로 수억 건의 데이터에서도 실시간 사례 기반 추론이 가능해짐.
|
|
- **정책 변화:** Antigravity 프로젝트의 지식 추천 엔진은 사용자의 현재 문맥과 가장 유사한 과거의 위키 탐색 경로를 찾아주는 사례 기반 추천 방식을 병행하여 개인화된 경험을 제공함.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Indexing-Strategies]], Vector-Database-Foundations, [[Supervised-Learning-Foundations]], Distance-Metrics-in-AI
|
|
- **Raw Source:** 10_Wiki/Topics/AI/Instance-based-Learning.md
|