Files
2nd/10_Wiki/Topics/Retrieval-Augmented-Generation-RAG.md
T

2.0 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
RAG-001 10_Wiki/💡 Topics/AI 1.0
ai
llm
rag
information-retrieval
vector-database
2026-04-26

Retrieval-Augmented Generation (RAG)

📌 한 줄 통찰 (The Karpathy Summary)

"모델의 내부 기억에만 의존하지 말고, 가장 최신의 도서관(외부 지식)을 참조하라" — 사용자의 질문에 답변하기 전 관련성 높은 신뢰 문서들을 검색하여 프롬프트에 주입함으로써, 환각(Hallucination)을 줄이고 답변의 정확성과 최신성을 확보하는 기술.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: 질문(Query) -> 검색(Retrieve) -> 보강(Augment) -> 생성(Generate)으로 이어지는 4단계 지식 주입 파이프라인 패턴.
  • 세부 구성 요소:
    • Vector Database: 문서들을 벡터(Embedding) 형태로 저장하고 유사도 기반으로 고속 검색.
    • Chunking: 긴 문서를 검색 효율을 높이기 위해 의미 있는 작은 조각으로 나눔.
    • Context Window Management: 검색된 정보 중 가장 관련성 높은 조각들을 모델의 컨텍스트 제한 내에 최적으로 배치.
    • Citation: 답변의 근거가 되는 출처(Source)를 명시하여 신뢰성 확보.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 단순히 모든 지식을 모델 가중치에 학습(Fine-tuning)시키려던 방식에서, 가중치는 '추론 엔진'으로 쓰고 지식은 '외부 DB'에서 가져오는 하이브리드 방식으로 정착.
  • 정책 변화: Antigravity 프로젝트는 모든 지식 생성 태스크에 RAG를 기본 아키텍처로 사용하며, 현재 보고 있는 이 위키 자체가 에이전트의 RAG 지식 베이스가 됨.

🔗 지식 연결 (Graph)