Files
2nd/10_Wiki/Topics_Rag/CRAG.md
T
koriweb 95cd8bb891 feat(wiki): 코드 그라운딩 23문서 + MOC 학습지도 39개
- 코드 그라운딩: 기술 주제 문서의 '적용 사례'에 실제 레포 구현 위치
  (file:line)+커밋 자동 주입 (예: 문서 청킹 전략→connectai/src/retrieval/chunker.ts).
  멱등 마커(CODE-GROUNDING)로 재실행 시 갱신.
- MOC: 39개 클러스터 폴더에 _MOC.md 학습지도 생성(진입점+통찰 주석).
도구: Datacollect/scripts/{code_grounding,moc_generator}.mjs

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-08 18:56:11 +09:00

8.3 KiB

id, title, category, status, verification_status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, created_at, updated_at, review_reason, merge_history, tags, raw_sources, applied_in, github_commit
id title category status verification_status canonical_id aliases duplicate_of source_trust_level confidence_score created_at updated_at review_reason merge_history tags raw_sources applied_in github_commit
crag CRAG AI_and_ML draft conceptual
Corrective RAG
교정 검색 증강 생성
Self-correcting RAG
RAG 2.0
Retrieval Evaluator Framework
A 0.94 2026-06-08 2026-06-08
research
CRAG
RAG 2.0
Self-Correction
Retrieval-Optimization
RAG의 진화: GraphRAG, Agentic RAG, CRAG의 등장 - CSLEE Tech Blog %
CRAG 논문: 'Corrective Retrieval Augmented Generation' arXiv:2401.15884 (2024)

CRAG

🎯 한 줄 통찰 (One-line insight)

CRAG는 검색된 문서의 품질을 실시간으로 자가 진단하고, 결과가 부정확할 경우 웹 검색 등 대체 수단을 동원해 답변의 신뢰성을 강제로 교정하는 '검증 중심 RAG' 아키텍처이다 [S15, S16].

🧠 핵심 개념 (Core concepts)

  • 검색 평가자 (Retrieval Evaluator): 검색된 각 문서의 관련성 점수를 매겨 신뢰도에 따라 행동(Correct, Incorrect, Ambiguous)을 결정하는 핵심 지능이다 [S15].
  • 지식 정제 (Knowledge Refinement): 관련 있는 문서에서도 불필요한 정보를 제거하기 위해 문서를 '지식 스트립(Knowledge Strip)' 단위로 원자화하고 핵심 정보만 추출하는 과정이다 [S15].
  • 웹 검색 확장 (Web Search Extension): 내부 지식 베이스만으로 답을 찾기 어려울 때 쿼리를 재작성하여 외부 웹 소스(Wikipedia 등)를 통해 지식을 보강하는 메커니즘이다 [S15].
  • 신뢰도 기반 트리거 (Confidence Trigger): 검색 결과의 정밀도에 따라 '정제 후 사용', '웹 검색 대체', '병행 사용'의 최적 경로를 동적으로 선택하는 의사결정 로직이다 [S15].

🧩 추출된 패턴 (Extracted patterns)

  • Evaluate-then-Act Pattern: 검색된 정보를 LLM에 무비판적으로 전달하기 전, 반드시 평가자 레이어를 거쳐 데이터의 순도를 검증하는 패턴이다 [S15, S16].
  • Knowledge Strip Atomization: 문서를 단순 조각이 아닌 의미 있는 정보 단위(Strips)로 분해하여 관련성을 재평가함으로써 정보의 밀도를 극대화하는 정제 패턴이다 [S15].
  • Fallback to External Knowledge: 내부 데이터베이스의 한계(Incorrect 판정 시)를 감지하면 자동으로 외부 웹 검색을 수행하여 정보의 부재를 해결하는 회복 탄력성 패턴이다 [S15].

📖 세부 내용 (Details)

1. CRAG의 탄생 배경 및 목적 [S15]

전통적 RAG(Naive RAG)는 검색된 문서가 실제 질문과 관련이 낮더라도 LLM이 이를 그대로 수용해 환각(Hallucination)을 일으키는 치명적 약점이 있다. CRAG(Corrective RAG)는 2024년 1월 발표된 기술로, 검색된 정보의 순도를 시스템 스스로 검증하여 이러한 '무비판적 수용' 문제를 해결하는 것을 목적으로 한다.

2. 핵심 컴포넌트 작동 원리 [S15, S16]

  • 검색 평가자 레이어: 1차 검색 결과에 대해 세 가지 상태로 분류한다.
    • Correct (정확): 관련성 높음. 문서를 '지식 스트립'으로 정제하여 답변 생성에 사용한다.
    • Incorrect (부정확): 관련성 없음. 내부 문서를 폐기하고 웹 검색으로 대체한다.
    • Ambiguous (애매): 확신 불가. 내부 문서 정제와 웹 검색 보강을 병행한다.
  • 지식 정제 프로세스: 관련 문서를 더 작은 단위로 분해하고, 각 조각의 관련성을 다시 점수화하여 가장 핵심적인 내용만 선별한다. 이를 통해 LLM에 전달되는 컨텍스트의 노이즈를 제거한다.
  • 쿼리 재작성 및 외부 검색: 내부 지식이 부족하다고 판단되면 사용자의 질문을 검색 엔진에 최적화된 형태로 재구성하여 외부 지식을 실시간으로 가져온다.

3. 주요 강점: 모듈화 [S15]

CRAG는 기존 RAG 파이프라인에 '평가자 레이어'만 플러그인(Plug-and-Play) 형태로 추가하면 되므로, 전체 시스템을 재구축할 필요 없이 점진적으로 성능을 개선할 수 있다는 설계상의 이점이 있다.

⚖️ 모순 및 업데이트 (Contradictions & updates)

  • 비용 vs 신뢰성: 검색 결과가 모호(Ambiguous)할 때 내부 정제와 외부 검색을 병행하므로, 단선적인 RAG보다 LLM 호출 횟수와 API 비용, 응답 지연 시간(Latency)이 증가하는 트레이드오프가 발생한다 [S16].
  • 검증의 주체: 원 논문에서는 T5-large 모델을 평가자로 제안했으나, 최근 실무에서는 GPT-4나 Claude와 같은 고성능 LLM을 평가자로 활용하는 추세로 업데이트되고 있다 [S15].

🛠️ 적용 사례 (Applied in summary)

  • 학술 연구: arXiv:2401.15884 논문을 통해 기술적 실체가 증명되었으며, 짧은 형식 및 긴 형식의 답변 생성 작업 모두에서 정확도 향상이 확인되었다 [S16].
  • RAG 2.0 시스템: 기업용 입찰 문서 분석이나 과거 사업 검토 시스템에서 검색 품질의 불확실성을 제거하기 위한 검증 레이어로 적용되고 있다 [S15, S16].

검증 상태 및 신뢰도

  • 상태: draft
  • 검증 단계: conceptual (원천 논문과 기술 분석 블로그를 통해 검증됨)
  • 출처 신뢰도: A (최신 arXiv 논문 및 전문 기술 분석 자료 기반)
  • 신뢰 점수: 0.94
  • 중복 검사 결과: 신규 생성 (New discovery)

상위/유사 개념

[아키텍처/기반 기술]

[RAG 2.0 기술군]

  • Agentic RAG
    • 연결 이유: 스스로 판단하고 도구(웹 검색 등)를 선택한다는 점에서 에이전트적 속성을 공유함 [S16].
  • GraphRAG
    • 연결 이유: GraphRAG가 지식의 '구조'를 검증한다면, CRAG는 정보의 '순도'를 검증함 [S16].

심층 후속 질문 (Deeper Research Questions)

  • 평가자 모델(T5 vs GPT-4)의 성능 차이가 전체 CRAG 시스템의 교정 정확도에 미치는 정량적 영향은 어느 정도인가? [S15]
  • '지식 스트립'의 분할 크기와 중첩도가 핵심 정보 추출 효율에 미치는 영향은 무엇인가? [S15]
  • 웹 검색 결과가 오염되었거나 편향되었을 경우, CRAG는 이를 2차로 검증하는 방안을 가지고 있는가? [S16]

실무 적용 맥락 (Practical Application Contexts)

  • Implementation: 기존 랭체인(LangChain) 파이프라인 중간에 RetrievalEvaluator 노드를 추가하여 구현 [S15].
  • System Design: 검색 점수(Score)의 임계값(Threshold)을 설정하여 Correct/Incorrect/Ambiguous의 분기 기준을 도메인 특성에 맞게 튜닝 [S15].
  • Operation / Maintenance: 교정 작업으로 인한 지연 시간을 관리하기 위해 정제 작업의 병렬 처리를 고려 [S16].
  • Learning Path: Naive RAG 구축 → 검색 점수 모니터링 → CRAG 평가자 도입 → 웹 검색 API 연동 순으로 학습 [S16].

인접 주변 주제

  • LLM-as-a-Judge
    • 확장 방향: CRAG의 평가자 역할을 LLM이 수행할 때의 평가 기준과 프롬프트 설계 전략 이해.

🔗 지식 그래프 (Knowledge Graph)

📚 출처 (Sources)

  • [S15] RAG의 진화: GraphRAG, Agentic RAG, CRAG의 등장 - CSLEE Tech Blog (작동 원리 및 컴포넌트)
  • [S16] RAG의 진화: GraphRAG, Agentic RAG, CRAG의 등장 - CSLEE Tech Blog (성능 향상 및 한계 전망)

📝 변경 이력 (Change history)

  • 2026-06-08: Initial draft generated via Datacollector_MAC P-Reinforce engine.