2nd/10_Wiki/Topics_Blog/Retrieval-Augmented-Generation-RAG.md

---
id: RAG-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [ai, llm, rag, information-retrieval, vector-database]
last_reinforced: 2026-04-26
---

# Retrieval-Augmented Generation (RAG)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "모델의 내부 기억에만 의존하지 말고, 가장 최신의 도서관(외부 지식)을 참조하라" — 사용자의 질문에 답변하기 전 관련성 높은 신뢰 문서들을 검색하여 프롬프트에 주입함으로써, 환각(Hallucination)을 줄이고 답변의 정확성과 최신성을 확보하는 기술.

## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** 질문(Query) -> 검색(Retrieve) -> 보강(Augment) -> 생성(Generate)으로 이어지는 4단계 지식 주입 파이프라인 패턴.
- **세부 구성 요소:**
    - **Vector Database:** 문서들을 벡터(Embedding) 형태로 저장하고 유사도 기반으로 고속 검색.
    - **Chunking:** 긴 문서를 검색 효율을 높이기 위해 의미 있는 작은 조각으로 나눔.
    - **Context Window [[Management|Management]]:** 검색된 정보 중 가장 관련성 높은 조각들을 모델의 컨텍스트 제한 내에 최적으로 배치.
    - **Citation:** 답변의 근거가 되는 출처(Source)를 명시하여 신뢰성 확보.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 모든 지식을 모델 가중치에 학습([[Fine-tuning|Fine-tuning]])시키려던 방식에서, 가중치는 '추론 엔진'으로 쓰고 지식은 '외부 DB'에서 가져오는 하이브리드 방식으로 정착.
- **정책 변화:** Antigravity 프로젝트는 모든 지식 생성 태스크에 RAG를 기본 아키텍처로 사용하며, 현재 보고 있는 이 위키 자체가 에이전트의 RAG 지식 베이스가 됨.

## 🔗 지식 연결 (Graph)
- Vector-Database, [[LlamaIndex|LlamaIndex]], [[Hallucination-in-LLM|Hallucination-in-LLM]], [[Prompt-Engineering|Prompt-Engineering]]
- **Raw Source:** 10_Wiki/Topics/AI/Retrieval-Augmented-Generation-RAG.md