--- id: P-REINFORCE-AI-VECTOR-DB category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 0.98 tags: [AI, VectorDB, RAG, SemanticSearch] last_reinforced: 2026-04-20 --- # [[벡ᄐα…₯ 데아ᄐα…₯베아스 (Vector Database)|벑터 λ°μ΄ν„°λ² μ΄μŠ€ (Vector Database)]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "의미의 μœ μ‚¬μ„±μ„ μ’Œν‘œλ‘œ μ°Ύμ•„λ‚΄λŠ” μ§€μ‹μ˜ GPS." ν…μŠ€νŠΈ, 이미지 λ“±μ˜ λΉ„μ •ν˜• 데이터λ₯Ό 고차원 λ²‘ν„°λ‘œ λ³€ν™˜ν•˜μ—¬, ν‚€μ›Œλ“œκ°€ μ•„λ‹Œ '의미적 μœ μ‚¬μ„±'을 λ°”νƒ•μœΌλ‘œ μ΄ˆκ³ μ† 검색을 μˆ˜ν–‰ν•˜λŠ” λ°μ΄ν„°λ² μ΄μŠ€λ‹€. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **Core Mechanism**: - **Embedding**: 데이터λ₯Ό 수천 개의 숫자둜 이루어진 λ²‘ν„°λ‘œ λ³€ν™˜. - **Indexing (ANN)**: λͺ¨λ“  데이터λ₯Ό λΉ„κ΅ν•˜λŠ” λŒ€μ‹ , 근사 κ·Όμ ‘ 이웃(Approximate Nearest Neighbor) μ•Œκ³ λ¦¬μ¦˜(HNSW λ“±)을 μ‚¬μš©ν•΄ μœ μ‚¬ν•œ 데이터λ₯Ό κ΄‘μ†μœΌλ‘œ 찾아냄. - **Distance Metrics**: 코사인 μœ μ‚¬λ„(Cosine Similarity)λ‚˜ μœ ν΄λ¦¬λ””μ•ˆ 거리λ₯Ό ν™œμš©ν•΄ μœ μ‚¬μ„± μΈ‘μ •. - **Main Use Cases**: - **RAG (Retrieval-Augmented Generation)**: LLMμ—κ²Œ μ™ΈλΆ€ 지식을 μ œκ³΅ν•˜κΈ° μœ„ν•œ 핡심 검색 μ—”μ§„. - **Recommendation Systems**: μ‚¬μš©μžμ˜ μ·¨ν–₯κ³Ό μœ μ‚¬ν•œ μƒν’ˆ/μ½˜ν…μΈ  λ§€μΉ­. - **Popular Tools**: Pinecone, Milvus, Weaviate, FAISS. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (RL Update) - 벑터 DBλŠ” 검색은 μž˜ν•˜μ§€λ§Œ 'μ •ν™•ν•œ ν‚€μ›Œλ“œ λ§€μΉ­'μ—λŠ” μ·¨μ•½ν•˜λ‹€. 이λ₯Ό λ³΄μ™„ν•˜κΈ° μœ„ν•΄ ν‚€μ›Œλ“œ 기반의 BM25 검색과 벑터 기반 검색을 μ„žμ€ 'ν•˜μ΄λΈŒλ¦¬λ“œ 검색(Hybrid Search)'이 사싀상 업계 ν‘œμ€€μœΌλ‘œ 자리 μž‘μ•˜λ‹€. ## πŸ”— 지식 μ—°κ²° (Graph) - Related: [[RAG (α„€α…₯ᆷᄉᅒᆨ α„Œα…³α†Όα„€α…‘α†Ό ᄉᅒᆼᄉα…₯α†Ό)|RAG (검색 증강 생성)]] , [[GraphRAG (α„€α…³α„…α…’α„‘α…³ 가ᄇᅑᆫ α„€α…₯ᆷᄉᅒᆨ α„Œα…³α†Όα„€α…‘α†Ό ᄉᅒᆼᄉα…₯α†Ό)|GraphRAG (κ·Έλž˜ν”„ 기반 검색 증강 생성)]] - Fundamental: Embedding-Space