docs(wiki): Finalized P-Reinforce v3.0 wikification of all 118 out_wiki assets

2026-05-04 13:33:35 +09:00
parent 772d3e11e0
commit 972cd84dba
28 changed files with 1054 additions and 0 deletions
@@ -0,0 +1,38 @@
+---
+id: [[P-Reinforce|P-Reinforce]]-AUTO-VDBS-001
+category: Unified
+confidence_score: 1.00
+tags: [auto-reinforced, vector-database, hnsw, indexing, semantic-search, similarity-search]
+last_reinforced: 2026-05-04
+---
+
+# [[Vector Databases & Search|Vector Databases & Search]]
+
+## 📌 한 줄 통찰 (The Karpathy Summary)
+> "의미의 도서관: 텍스트, 이미지, 오디오 등의 비정형 데이터를 수학적 좌표(Vector)로 변환하고, 수억 개의 데이터 중 가장 유사한 의미를 가진 정보를 수 밀리초 만에 찾아내는 현대 AI의 거대한 지식 저장소."
+
+## 📖 구조화된 지식 (Synthesized Content)
+벡터 데이터베이스는 데이터를 고차원 벡터로 인덱싱하여 빠른 유사도 검색(Similarity Search)을 가능하게 하는 시스템입니다.
+
+1.  **핵심 작동 원리**:
+    *   **임베딩 변환**: 데이터를 [[Embedding Models|Embedding Models]]를 통해 수천 차원의 벡터로 변환합니다.
+    *   **인덱싱 (Indexing)**: 검색 속도를 높이기 위해 데이터를 구조화합니다. (예: [[HNSW]], IVF, PQ)
+    *   **유사도 계산**: 코사인 유사도(Cosine Similarity)나 유클리디안 거리 등을 사용하여 쿼리와 가장 가까운 벡터들을 찾습니다.
+2.  **주요 인덱싱 알고리즘 - HNSW**:
+    *   **계층적 그래프**: 데이터 포인트들을 계층적인 그래프 구조로 연결하여, '좁은 세상(Small World)' 네트워크 원리를 이용해 빠르게 목표에 도달합니다.
+    *   **특징**: 메모리 사용량은 많지만 검색 속도와 정확도가 매우 뛰어나 대부분의 상용 벡터 DB의 표준으로 자리 잡았습니다.
+3.  **대표적 솔루션**:
+    *   **클라우드/매니지드**: Pinecone, Weaviate, Qdrant.
+    *   **오픈소스/설치형**: Milvus, ChromaDB, FAISS.
+
+## ⚖️ Trade-offs & Caveats
+*   **비용과 자원**: 벡터 데이터와 인덱스를 메모리(RAM)에 올려두어야 성능이 나오기 때문에 인프라 비용이 높습니다.
+*   **정확도와 속도의 절충**: 완벽한 검색(Exact Search) 대신 근사 검색(ANN, Approximate Nearest Neighbor)을 사용하므로 100% 재현율을 보장하지는 않습니다.
+
+## 🔗 지식 연결 (Graph)
+*   **기반 기술**: [[Embedding Models & MRL|Embedding Models & MRL]], [[Chunking & Pre-processing|Chunking & Pre-processing]]
+*   **응용 분야**: [[Retrieval-Augmented Generation (RAG)|RAG]], [[Agent Memory Systems|Agent Memory Systems]]
+*   **연관 기술**: [[Hybrid Search|Hybrid Search]], [[Quantization|Quantization]]
+
+---
+*Last updated: 2026-05-04*