feat: achieve 600 files milestone in AI knowledge base

This commit is contained in:
2026-04-20 19:10:32 +09:00
parent ed5140096e
commit ae1627c35b
713 changed files with 21197 additions and 1994 deletions
@@ -1,25 +1,29 @@
---
id: P-REINFORCE-AUTO-A4C204
id: P-REINFORCE-AI-VECTOR-DB
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.98
tags: [AI, VectorDB, RAG, SemanticSearch]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - 벡터 데이터베이스 (Vector Database)"
---
# [[벡터 데이터베이스 (Vector Database)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> "의미의 유사성을 좌표로 찾아내는 지식의 GPS." 텍스트, 이미지 등의 비정형 데이터를 고차원 벡터로 변환하여, 키워드가 아닌 '의미적 유사성'을 바탕으로 초고속 검색을 수행하는 데이터베이스다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Core Mechanism**:
- **Embedding**: 데이터를 수천 개의 숫자로 이루어진 벡터로 변환.
- **Indexing (ANN)**: 모든 데이터를 비교하는 대신, 근사 근접 이웃(Approximate Nearest Neighbor) 알고리즘(HNSW 등)을 사용해 유사한 데이터를 광속으로 찾아냄.
- **Distance Metrics**: 코사인 유사도(Cosine Similarity)나 유클리디안 거리를 활용해 유사성 측정.
- **Main Use Cases**:
- **RAG (Retrieval-Augmented Generation)**: LLM에게 외부 지식을 제공하기 위한 핵심 검색 엔진.
- **Recommendation Systems**: 사용자의 취향과 유사한 상품/콘텐츠 매칭.
- **Popular Tools**: Pinecone, Milvus, Weaviate, FAISS.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 벡터 DB는 검색은 잘하지만 '정확한 키워드 매칭'에는 취약하다. 이를 보완하기 위해 키워드 기반의 BM25 검색과 벡터 기반 검색을 섞은 '하이브리드 검색(Hybrid Search)'이 사실상 업계 표준으로 자리 잡았다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/벡터 데이터베이스 (Vector Database).md]]
---
- Related: [[RAG (검색 증강 생성)]] , [[GraphRAG (그래프 기반 검색 증강 생성)]]
- Fundamental: [[Embedding-Space]]