Files
2nd/10_Wiki/Topics/RAG (검색 증강 생성).md
T

2.6 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AUTO-RAG-001 10_Wiki/💡 Topics/AI 0.98
auto-reinforced
llm
rag
information-retrieval
ai-accuracy
2026-04-20

RAG (검색 증강 생성)

📌 한 줄 통찰 (The Karpathy Summary)

"오픈 북 시험을 치는 AI: 모든 정보를 다 외우게 시키는 대신, 질문을 받으면 관련된 문서를 실시간으로 찾아 읽고 답변하게 하여 할루시네이션(환각)을 획기적으로 줄이는 기술."

📖 구조화된 지식 (Synthesized Content)

RAG(Retrieval-Augmented Generation)는 사전에 학습된 언어 모델(LLM)에 외부의 최신 데이터나 전문 지식을 실시간으로 연결하여 답변의 정확성을 높이는 프레임워크입니다.

  1. 작동 프로세스:
    • Retrieval (검색): 유저의 질문과 가장 관련성 높은 지식 조각들을 벡터 데이터베이스 등에서 추출.
    • Augmentation (증강): 추출된 문서를 질문과 섞어서 LLM에게 '참고할 배경 지식'으로 제공.
    • Generation (생성): LLM이 제공된 정보를 바탕으로 근거 있는 답변 생성.
  2. 핵심 이점:
    • 최신성 확보: 모델을 다시 학습(Fine-tuning)시키지 않고도 어제 일어난 뉴스나 사내 최신 문서를 기반으로 답변 가능.
    • 환각 증상 감소: "내가 아는 바에 따르면"이 아니라 "제시된 문서에 따르면" 답변하므로 오류가 눈에 띄게 줄어듦.
    • 출처 제시: 답변의 근거가 된 문서 링크나 인용구를 함께 제공하여 신뢰성 확보.
  3. 한계점:
    • 검색 단계에서 잘못된 문서를 가져오면(IR Failure) 답변도 망가짐. 이를 위해 검색 성능 최적화가 필수적임.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 초기 LLM은 '외운 것'으로만 답하게 하려 했으나, 정보의 방대함과 변화 속도를 감당할 수 없어 현대 기업용 AI 구축의 표준은 'RAG-First' 정책으로 완전히 전환됨.
  • 정책 변화(RL Update): 민감한 사내 문서가 RAG 과정에서 외부망(Public LLM API)으로 유출될 위험이 제기됨에 따라, '로컬 벡터 스토어'와 '격리된 LLM 연계'를 강제하는 엔터프라이즈 AI 보안 정책이 강화됨.

🔗 지식 연결 (Graph)

  • Foundational Models, SFT (Supervised Fine-Tuning), Vector Semantics, Information Extraction (IE), Semantic Grounding Provenance
  • Modern Tech/Tools: Pinecone, Milvus, LlamaIndex, LangChain.