id: P-Reinforce-AUTO-RAGM-001 category: Unified confidence_score: 1.00 tags: [auto-reinforced, rag, retrieval-augmented-generation, knowledge-base, llm-context] last_reinforced: 2026-05-04

Retrieval-Augmented Generation (RAG)

"오픈 북 테스트의 정석: 모든 지식을 모델의 파라미터에 우겨넣는 대신, 필요할 때마다 외부 지식 창고에서 관련 정보를 찾아 모델에게 전달함으로써 정확도를 높이고 환각을 줄이는 실용주의적 AI 아키텍처."

RAG(검색 증강 생성)는 거대 언어 모델이 학습 데이터에 없는 최신 정보나 특정 도메인의 지식을 활용할 수 있도록, 외부 데이터베이스에서 관련 문서를 검색하여 프롬프트에 포함시키는 기술입니다.

작동 프로세스:
- Indexing (인덱싱): 방대한 문서를 작은 조각(Chunk)으로 나누고 벡터(Vector) 형태로 변환하여 저장합니다.
- Retrieval (검색): 사용자의 질문과 유사한 의미를 가진 문서 조각들을 데이터베이스에서 찾아냅니다.
- Generation (생성): 검색된 조각들을 질문과 함께 모델에게 전달하여, 해당 근거를 바탕으로 답변을 생성하게 합니다.
핵심 이점:
- 환각(Hallucination) 감소: 모델이 근거 문서를 보고 답변하므로 없는 사실을 지어낼 확률이 줄어듭니다.
- 최신성 유지: 모델을 재학습시키지 않고도 외부 데이터베이스만 업데이트하면 최신 지식을 반영할 수 있습니다.
- 설명 가능성: 답변의 출처(Source/Citation)를 명확히 제시할 수 있어 신뢰도가 높습니다.
발전 단계:
- Naive RAG: 단순 벡터 검색 기반.
- Advanced RAG: 하이브리드 검색, 재순위화(Re-ranking), 쿼리 변환 등을 포함.
- Agentic RAG: 에이전트가 스스로 검색 전략을 수립하고 결과의 적절성을 평가하며 루프를 수행.

검색 의존성: 검색 결과가 부실하면 답변 품질도 급격히 떨어집니다. (Garbage In, Garbage Out)
지연 시간: 외부 검색 단계가 추가되므로 순수 생성보다 응답 속도가 느려질 수 있습니다.
Lost in the middle: 너무 많은 정보를 검색하여 전달할 경우, 모델이 컨텍스트 중간에 있는 중요한 정보를 놓치는 현상이 발생할 수 있습니다.

Last updated: 2026-05-04