Files
2nd/10_Wiki/Topics/AI_and_ML/Instance-based-Learning.md
T

2.4 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
ML-INST-001 Unified 1.0
machine-learning
instance-based-learning
knn
lazy-learning
Similarity-Metrics|Similarity-Metrics
2026-04-26

Instance-based Learning (사례 기반 학습)

📌 한 줄 통찰 (The Karpathy Summary)

"복잡한 수식을 만들지 말고, 가장 닮은 과거의 이웃에게 길을 물어 답을 찾아라" — 별도의 학습 과정 없이 훈련 데이터를 그대로 저장해 두었다가, 새로운 데이터가 유입될 때마다 유사도 측정을 통해 가장 가까운 사례들의 정답을 인용하는 머신러닝 방식.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: "Lazy Learning" — 추상적인 모델을 구축하는 비용을 아끼는 대신, 추론 시점에 모든 연산을 집중하여 실시간으로 데이터 간의 거리를 계산하는 지연 추론 패턴.
  • 핵심 알고리즘:
    • k-Nearest Neighbors (k-NN): 가장 가까운 k개의 이웃을 찾아 다수결이나 평균으로 예측.
    • Case-Based Reasoning (CBR): 과거의 성공 사례를 검색하고, 현재 문제에 맞게 수정하여 적용.
  • 장점 및 단점:
    • 장점: 데이터가 추가될 때 재학습이 필요 없음. 국지적(Local) 특징 반영에 강함.
    • 단점: 데이터가 많아질수록 추론 속도가 급격히 느려짐(연산 부하). 노이즈에 취약함.
  • 의의: 추천 시스템(Collaborative Filtering)이나 이상 징후 탐지 등 데이터의 유사성이 판단의 핵심인 분야에서 널리 활용됨.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 연산 성능의 한계로 소규모 데이터에만 쓰이던 방식이, 이제는 벡터 데이터베이스와 고성능 인덱싱 기술(HNSW 등)의 발전으로 수억 건의 데이터에서도 실시간 사례 기반 추론이 가능해짐.
  • 정책 변화: Antigravity 프로젝트의 지식 추천 엔진은 사용자의 현재 문맥과 가장 유사한 과거의 위키 탐색 경로를 찾아주는 사례 기반 추천 방식을 병행하여 개인화된 경험을 제공함.

🔗 지식 연결 (Graph)