3.0 KiB
3.0 KiB
id: P-Reinforce-AUTO-RAGM-001 category: Unified confidence_score: 1.00 tags: [auto-reinforced, rag, retrieval-augmented-generation, knowledge-base, llm-context] last_reinforced: 2026-05-04
Retrieval-Augmented Generation (RAG)
📌 한 줄 통찰 (The Karpathy Summary)
"오픈 북 테스트의 정석: 모든 지식을 모델의 파라미터에 우겨넣는 대신, 필요할 때마다 외부 지식 창고에서 관련 정보를 찾아 모델에게 전달함으로써 정확도를 높이고 환각을 줄이는 실용주의적 AI 아키텍처."
📖 구조화된 지식 (Synthesized Content)
RAG(검색 증강 생성)는 거대 언어 모델이 학습 데이터에 없는 최신 정보나 특정 도메인의 지식을 활용할 수 있도록, 외부 데이터베이스에서 관련 문서를 검색하여 프롬프트에 포함시키는 기술입니다.
- 작동 프로세스:
- Indexing (인덱싱): 방대한 문서를 작은 조각(Chunk)으로 나누고 벡터(Vector) 형태로 변환하여 저장합니다.
- Retrieval (검색): 사용자의 질문과 유사한 의미를 가진 문서 조각들을 데이터베이스에서 찾아냅니다.
- Generation (생성): 검색된 조각들을 질문과 함께 모델에게 전달하여, 해당 근거를 바탕으로 답변을 생성하게 합니다.
- 핵심 이점:
- 환각(Hallucination) 감소: 모델이 근거 문서를 보고 답변하므로 없는 사실을 지어낼 확률이 줄어듭니다.
- 최신성 유지: 모델을 재학습시키지 않고도 외부 데이터베이스만 업데이트하면 최신 지식을 반영할 수 있습니다.
- 설명 가능성: 답변의 출처(Source/Citation)를 명확히 제시할 수 있어 신뢰도가 높습니다.
- 발전 단계:
- Naive RAG: 단순 벡터 검색 기반.
- Advanced RAG: 하이브리드 검색, 재순위화(Re-ranking), 쿼리 변환 등을 포함.
- Agentic RAG: 에이전트가 스스로 검색 전략을 수립하고 결과의 적절성을 평가하며 루프를 수행.
⚖️ Trade-offs & Caveats
- 검색 의존성: 검색 결과가 부실하면 답변 품질도 급격히 떨어집니다. (Garbage In, Garbage Out)
- 지연 시간: 외부 검색 단계가 추가되므로 순수 생성보다 응답 속도가 느려질 수 있습니다.
- Lost in the middle: 너무 많은 정보를 검색하여 전달할 경우, 모델이 컨텍스트 중간에 있는 중요한 정보를 놓치는 현상이 발생할 수 있습니다.
🔗 지식 연결 (Graph)
- 상위 개념: LLM Application Architecture
- 세부 기술: Agentic RAG, GraphRAG, Hybrid Search, Re-ranking
- 최적화 도구: LlamaIndex, LangChain, ChromaDB, Pinecone
Last updated: 2026-05-04