[P-Reinforce] Cleanup wikified files in 00_Raw (RAG, Harness, MCP, State Store, Agentic SE)

2026-05-01 09:32:35 +09:00
parent c630ae52e7
commit 8083f59e40
23 changed files with 664 additions and 385 deletions
@@ -1,31 +1,44 @@
 ---
-id: P-REINFORCE-AUTO-RAGG-001
-category: "10_Wiki/💡 Topics/AI"
+id: d7f2e1b4-c3a5-4e8b-9d2f-1c6b4a2d3e4f
+category: "[[10_Wiki/Topics/AI]]"
 confidence_score: 0.98
-tags: [auto-reinforced, rag, llm, knowledge-injection, hallucination-mitigation, vector-db]
-last_reinforced: 2026-04-20
+tags: [rag, ai, retrieval, context, agent, infrastructure]
+last_reinforced: 2026-05-01
+github_commit: "wikification-rag"
 ---

-# [[RAG]]
+# [[RAG (Retrieval-Augmented Generation)]]

 ## 📌 한 줄 통찰 (The Karpathy Summary)
-> "AI의 '오픈북 테스트': 모델이 학습하지 않은 최신 데이터나 회사 기밀 지식을 검색기(Retriever)가 실시간으로 찾아와서 질문과 함께 던져줌으로써, 환각(Hallucination) 없이 가장 정확하고 근거 있는 답변을 내놓게 만드는 LLM 시대의 핵심 지식 보조 장치."
+> RAG는 AI 모델의 정보 생성 전 사실적 근거를 외부 데이터에서 검색하여 주입함으로써 환각을 억제하며, 현대 에이전틱 시스템에서는 모델이 자율적으로 도구를 호출하여 필요한 정보를 점진적으로 확보하는 '능동적 지식 확장' 전략으로 진화했다.

 ## 📖 구조화된 지식 (Synthesized Content)
-검색 증강 생성(RAG)은 외부 지식 베이스에서 관련 정보를 검색하여 LLM의 출력을 보강하는 아키텍처입니다.

-1.  **3단계 프로세스**:
-    *   **Retrieve**: 질문과 유사한 지식 조각을 벡터 DB 등에서 찾아옴. (LSH와 연결 가능)
-    *   **Augment**: 찾아온 지식(Context)을 원래의 질문 앞에 붙임. (Prompt-Engineering 활용)
-    *   **Generate**: 풍부해진 맥락을 바탕으로 LLM이 최종 답변 생성. (Large Language Models (LLM)와 연결)
-2.  **왜 중요한가?**:
-    *   모델을 매번 재학습(Fine-tuning)하지 않고도 새로운 지식을 즉시 주입 가능하며, 답변의 출처를 명시할 수 있어 신뢰도를 극대화하기 때문임. (Explainable-AI (XAI)와 연결)
+### 1. 에이전틱 RAG (Agentic RAG)의 부상
+- **수동적 검색에서 자율 호출로**: 단순히 사용자 쿼리 시점에 문서를 일괄 주입하는 방식에서 벗어나, 에이전트가 추론 과정 중 필요 시 검색 도구(Keyword, Semantic, SQL 등)를 직접 호출하여 정보를 가져온다.
+- **점진적 컨텍스트 보강**: 에이전트는 각 단계에서 필요한 최소한의 정보만 가져옴으로써 인지 부하를 줄이고 추론의 정확도를 높인다.
+
+### 2. 검색 증강 컨텍스트 관리
+- **장기 메모리 구현**: 에이전트의 상호작용 기록 전체를 저장하고, 현재 작업과 연관된 하위 집합(Subset)만을 검색해 컨텍스트 윈도우에 주입함으로써 장기 실행 작업의 일관성을 유지한다.
+- **압축 및 추출**: Haystack 등 프레임워크를 통해 검색된 정보의 압축 및 핵심 추출 과정을 거쳐 모델에 전달한다.
+
+### 3. GraphRAG: 지식 그래프와의 결합
+- **관계 기반 추론**: 벡터 검색의 한계인 다단계(Multi-hop) 질문이나 전체적인 요약 문제를 해결하기 위해, 문서 간의 관계를 매핑한 지식 그래프와 결합하여 고도화된 의미론적 회상을 구현한다.
+
+### 4. MCP와의 상호작용
+- **지식 검색 vs 작업 실행**: RAG가 정보의 '수동적/능동적 검색'을 통한 사실성 확보에 주력한다면, MCP는 에이전트가 외부 시스템에서 작업을 '실행'하고 소통하는 표준을 제공하여 상호 보완한다.

 ## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 단순히 키워드로 검색했으나, 현대 정책은 의미적 유사성 정책을 계산하는 '시맨틱 검색 정책'과 여러 지식을 엮어 추론하는 '고급 RAG 정책(Graph RAG 등)'으로 진화함(RL Update).
- **정책 변화(RL Update)**: 본 시스템인 P-Reinforce 또한 Obsidian에 저장된 600개의 정제된 지식 정책들을 RAG의 소스 정책으로 활용하여, 대표님의 질문에 가장 정확한 답 정책을 내놓기 위한 준비 정책을 하는 것임.
+- **지연 시간 오버헤드**: 매 단계 검색 쿼리가 추가됨에 따라 전체 실행 시간이 선형적으로 증가하며, 이는 하네스 차원의 인덱스 예열 및 캐싱으로 최적화해야 한다.
+- **검색 게임화 (Adversarial RAG)**: 외부 데이터에 조작된 유사 콘텐츠가 섞여 있을 경우 에이전트가 악의적 지시문을 최우선으로 검색할 위험이 있으며, 출처 기반 가중치 부여가 필수적이다.
+- **긴 컨텍스트 모델과의 경합**: 초장기 컨텍스트 모델이 등장함에 따라 모든 데이터를 직접 주입하는 방식과 RAG 검색 방식 사이의 비용-성능 균형점이 변화하고 있다.

 ## 🔗 지식 연결 (Graph)
- [[Large Language Models (LLM)]], [[Prompt-Engineering]], [[Explainable-AI (XAI)]], [[Knowledge synthesis]], Vector-Database
- **Modern Tech/Tools**: LangChain, LlamaIndex, Pinecone, FAISS, GraphRAG.
---
+- **Parent**: [[10_Wiki/Topics/AI]]
+- **Related**: [[Context Engineering]], [[Agentic Search]], [[GraphRAG]], [[Model Context Protocol (MCP)]]
+- **Raw Source**: [[00_Raw/RAG (Retrieval-Augmented Generation)]]
+
+## 💻 GitHub 동기화 자동화 워크플로우
+1. Stage: git add .
+2. Commit: `git commit -m "[P-Reinforce] Wikify RAG (Retrieval-Augmented Generation)"`
+3. Push: `git push origin main`