2.1 KiB
2.1 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | |||||
|---|---|---|---|---|---|---|---|---|---|
| RAG-001 | 10_Wiki/💡 Topics/AI | 1.0 |
|
2026-04-26 |
Retrieval-Augmented Generation (RAG)
📌 한 줄 통찰 (The Karpathy Summary)
"모델의 내부 기억에만 의존하지 말고, 가장 최신의 도서관(외부 지식)을 참조하라" — 사용자의 질문에 답변하기 전 관련성 높은 신뢰 문서들을 검색하여 프롬프트에 주입함으로써, 환각(Hallucination)을 줄이고 답변의 정확성과 최신성을 확보하는 기술.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: 질문(Query) -> 검색(Retrieve) -> 보강(Augment) -> 생성(Generate)으로 이어지는 4단계 지식 주입 파이프라인 패턴.
- 세부 구성 요소:
- Vector Database: 문서들을 벡터(Embedding) 형태로 저장하고 유사도 기반으로 고속 검색.
- Chunking: 긴 문서를 검색 효율을 높이기 위해 의미 있는 작은 조각으로 나눔.
- Context Window Management: 검색된 정보 중 가장 관련성 높은 조각들을 모델의 컨텍스트 제한 내에 최적으로 배치.
- Citation: 답변의 근거가 되는 출처(Source)를 명시하여 신뢰성 확보.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 단순히 모든 지식을 모델 가중치에 학습(Fine-tuning)시키려던 방식에서, 가중치는 '추론 엔진'으로 쓰고 지식은 '외부 DB'에서 가져오는 하이브리드 방식으로 정착.
- 정책 변화: Antigravity 프로젝트는 모든 지식 생성 태스크에 RAG를 기본 아키텍처로 사용하며, 현재 보고 있는 이 위키 자체가 에이전트의 RAG 지식 베이스가 됨.
🔗 지식 연결 (Graph)
- Vector-Database, LlamaIndex, Hallucination-in-LLM, Prompt-Engineering
- Raw Source: 10_Wiki/Topics/AI/Retrieval-Augmented-Generation-RAG.md