docs(wiki): Finalized P-Reinforce v3.0 wikification of all 118 out_wiki assets

2026-05-04 13:33:35 +09:00
parent 772d3e11e0
commit 972cd84dba
28 changed files with 1054 additions and 0 deletions
@@ -0,0 +1,35 @@
+---
+id: [[P-Reinforce|P-Reinforce]]-AUTO-EMRL-001
+category: Unified
+confidence_score: 1.00
+tags: [auto-reinforced, embedding-models, mrl, dimensionality-reduction, vector-compression]
+last_reinforced: 2026-05-04
+---
+
+# [[Embedding Models & MRL|Embedding Models & MRL]]
+
+## 📌 한 줄 통찰 (The Karpathy Summary)
+> "데이터의 지도 제작자: 복잡한 현실 세계의 정보를 의미적 거리가 유지되는 수학적 공간에 배치하고, 특히 MRL을 통해 중요한 정보만 벡터의 앞쪽에 농축하여 효율과 성능의 조화를 이루어낸 기술."
+
+## 📖 구조화된 지식 (Synthesized Content)
+임베딩 모델은 텍스트나 이미지 같은 데이터를 고차원 벡터로 변환하는 핵심 인공지능 모델이며, MRL은 이를 더욱 효율적으로 사용하는 최신 기법입니다.
+
+1.  **임베딩 모델 (Embedding Models)**:
+    *   **역할**: 단어의 단순 매칭을 넘어, "왕"과 "군주"가 비슷한 의미임을 수학적으로 이해하게 합니다.
+    *   **발전**: 텍스트뿐만 아니라 이미지와 텍스트를 동시에 이해하는 멀티모달(Multimodal) 임베딩으로 진화하고 있습니다.
+2.  **MRL (Matryoshka Representation Learning)**:
+    *   **원리**: 마트료시카 인형처럼, 벡터의 앞쪽 차원(예: 3072차원 중 앞쪽 256차원)만 잘라내어 사용해도 대부분의 의미를 보존하도록 모델을 훈련합니다.
+    *   **장점**: 저장 공간을 10배 이상 절감하면서도 검색 품질 손실을 1% 미만으로 억제할 수 있습니다.
+    *   **주요 지원 모델**: OpenAI text-embedding-3, Voyage-3, Gemini embedding-001.
+
+## ⚖️ Trade-offs & Caveats
+*   **차원 축소의 한계**: 차원을 과하게 줄이면 미세한 의미 차이(Nuance)를 구분하는 능력이 떨어집니다.
+*   **모델 종속성**: MRL 효과는 해당 기법으로 특수하게 훈련된 모델에서만 발휘됩니다. 일반 모델의 벡터를 그냥 잘라 쓰면 성능이 급격히 파괴됩니다.
+
+## 🔗 지식 연결 (Graph)
+*   **하위 시스템**: [[Vector Databases & Search|Vector Databases & Search]]
+*   **최적화 기술**: [[Quantization|Quantization]], [[Model Compression & Quantization|Model Compression & Quantization]]
+*   **적용 사례**: 대규모 RAG 시스템, 로컬 [[Second Brain|Second Brain]] 인프라
+
+---
+*Last updated: 2026-05-04*