2.6 KiB
2.6 KiB
id: P-Reinforce-AUTO-GRAG-001 category: Unified confidence_score: 0.95 tags: [auto-reinforced, graphrag, knowledge-graph, relational-reasoning, structured-knowledge] last_reinforced: 2026-05-04
GraphRAG
📌 한 줄 통찰 (The Karpathy Summary)
"관계의 그물망: 파편화된 문서 조각(Chunk)을 넘어, 정보 간의 논리적 연결 고리를 노드와 엣지로 구조화함으로써 복잡한 인과 관계와 전체 맥락을 꿰뚫는 고차원적 검색 증강 기술."
📖 구조화된 지식 (Synthesized Content)
GraphRAG는 정보를 노드(Node)와 엣지(Edge) 형태의 지식 그래프(Knowledge Graph)로 구성하여 검색 성능을 높이는 RAG의 진화된 형태입니다.
- 핵심 차이점:
- 전통적 RAG: 텍스트를 단순한 조각(Chunk)으로 나누어 벡터 공간에 배치
\rightarrow정보 간의 맥락적 연결이 끊어질 위험이 큼. - GraphRAG: 엔티티(Entity) 간의 관계를 명시적으로 정의
\rightarrow"A가 B의 원인이다"와 같은 구조적 지식을 보존.
- 전통적 RAG: 텍스트를 단순한 조각(Chunk)으로 나누어 벡터 공간에 배치
- 주요 이점:
- 관계적 추론 (Relational Reasoning): 단순 키워드 매칭으로는 찾기 힘든 데이터 간의 잠재적 연관성을 효과적으로 탐색합니다.
- 전체론적 요약: 특정 조각이 아닌 전체 그래프를 탐색하여 문서 집합 전체에 대한 고수준의 통찰을 제공할 수 있습니다.
- IBM의 평가: 기존 RAG가 가진 관계적 추론의 한계를 극복하는 가장 효과적인 대안 중 하나로 꼽힙니다.
- 작동 원리:
- LLM을 사용하여 비정형 텍스트에서 엔티티와 관계를 추출하고 그래프 DB(예: Neo4j)를 구축합니다.
- 질문이 들어오면 그래프 탐색(Graph Traversal)을 통해 관련 노드와 엣지를 수집하여 답변 생성에 활용합니다.
⚖️ Trade-offs & Caveats
- 높은 전처리 비용: 텍스트에서 그래프를 추출하고 구축하는 과정에서 LLM 토큰 비용과 시간이 Naive RAG보다 월등히 많이 소요됩니다.
- 그래프 유지보수: 새로운 데이터가 추가될 때 기존 그래프와의 무결성을 유지하며 업데이트하는 과정이 복잡합니다.
🔗 지식 연결 (Graph)
- 상위 개념: Retrieval-Augmented Generation (RAG), Knowledge Graph
- 연관 기술: Entity Extraction, Vector Database, Reasoning Chains
Last updated: 2026-05-04