bluemsi/2nd

Files

T

koriweb 3d9d0077cc feat: organize and categorize 1535 knowledge assets into wiki topics (2026-04-29)

2026-04-29 18:14:09 +09:00

2.0 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

RAG-001

10_Wiki/💡 Topics/AI

1.0

ai

llm

rag

information-retrieval

vector-database

2026-04-26

Retrieval-Augmented Generation (RAG)

📌 한 줄 통찰 (The Karpathy Summary)

"모델의 내부 기억에만 의존하지 말고, 가장 최신의 도서관(외부 지식)을 참조하라" — 사용자의 질문에 답변하기 전 관련성 높은 신뢰 문서들을 검색하여 프롬프트에 주입함으로써, 환각(Hallucination)을 줄이고 답변의 정확성과 최신성을 확보하는 기술.

📖 구조화된 지식 (Synthesized Content)

추출된 패턴: 질문(Query) -> 검색(Retrieve) -> 보강(Augment) -> 생성(Generate)으로 이어지는 4단계 지식 주입 파이프라인 패턴.
세부 구성 요소:
- Vector Database: 문서들을 벡터(Embedding) 형태로 저장하고 유사도 기반으로 고속 검색.
- Chunking: 긴 문서를 검색 효율을 높이기 위해 의미 있는 작은 조각으로 나눔.
- Context Window Management: 검색된 정보 중 가장 관련성 높은 조각들을 모델의 컨텍스트 제한 내에 최적으로 배치.
- Citation: 답변의 근거가 되는 출처(Source)를 명시하여 신뢰성 확보.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 단순히 모든 지식을 모델 가중치에 학습(Fine-tuning)시키려던 방식에서, 가중치는 '추론 엔진'으로 쓰고 지식은 '외부 DB'에서 가져오는 하이브리드 방식으로 정착.
정책 변화: Antigravity 프로젝트는 모든 지식 생성 태스크에 RAG를 기본 아키텍처로 사용하며, 현재 보고 있는 이 위키 자체가 에이전트의 RAG 지식 베이스가 됨.

🔗 지식 연결 (Graph)

Vector-Database, LlamaIndex, Hallucination-in-LLM, Prompt-Engineering
Raw Source: 10_Wiki/Topics/AI/Retrieval-Augmented-Generation-RAG.md