Instance-based Learning (사례 기반 학습)

📌 한 줄 통찰 (The Karpathy Summary)

"복잡한 수식을 만들지 말고, 가장 닮은 과거의 이웃에게 길을 물어 답을 찾아라" — 별도의 학습 과정 없이 훈련 데이터를 그대로 저장해 두었다가, 새로운 데이터가 유입될 때마다 유사도 측정을 통해 가장 가까운 사례들의 정답을 인용하는 머신러닝 방식.

추출된 패턴: "Lazy Learning" — 추상적인 모델을 구축하는 비용을 아끼는 대신, 추론 시점에 모든 연산을 집중하여 실시간으로 데이터 간의 거리를 계산하는 지연 추론 패턴.
핵심 알고리즘:
- k-Nearest Neighbors (k-NN): 가장 가까운 k개의 이웃을 찾아 다수결이나 평균으로 예측.
- Case-Based Reasoning (CBR): 과거의 성공 사례를 검색하고, 현재 문제에 맞게 수정하여 적용.
장점 및 단점:
- 장점: 데이터가 추가될 때 재학습이 필요 없음. 국지적(Local) 특징 반영에 강함.
- 단점: 데이터가 많아질수록 추론 속도가 급격히 느려짐(연산 부하). 노이즈에 취약함.
의의: 추천 시스템(Collaborative Filtering)이나 이상 징후 탐지 등 데이터의 유사성이 판단의 핵심인 분야에서 널리 활용됨.

과거 데이터와의 충돌: 연산 성능의 한계로 소규모 데이터에만 쓰이던 방식이, 이제는 벡터 데이터베이스와 고성능 인덱싱 기술(HNSW 등)의 발전으로 수억 건의 데이터에서도 실시간 사례 기반 추론이 가능해짐.
정책 변화: Antigravity 프로젝트의 지식 추천 엔진은 사용자의 현재 문맥과 가장 유사한 과거의 위키 탐색 경로를 찾아주는 사례 기반 추천 방식을 병행하여 개인화된 경험을 제공함.

Indexing-Strategies, Vector-Database-Foundations, Supervised-Learning-Foundations, Distance-Metrics-in-AI
Raw Source: 10_Wiki/Topics/AI/Instance-based-Learning.md