CRAG는 검색된 문서의 품질을 실시간으로 자가 진단하고, 결과가 부정확할 경우 웹 검색 등 대체 수단을 동원해 답변의 신뢰성을 강제로 교정하는 '검증 중심 RAG' 아키텍처이다 [S15, S16].
🧠 핵심 개념 (Core concepts)
검색 평가자 (Retrieval Evaluator): 검색된 각 문서의 관련성 점수를 매겨 신뢰도에 따라 행동(Correct, Incorrect, Ambiguous)을 결정하는 핵심 지능이다 [S15].
지식 정제 (Knowledge Refinement): 관련 있는 문서에서도 불필요한 정보를 제거하기 위해 문서를 '지식 스트립(Knowledge Strip)' 단위로 원자화하고 핵심 정보만 추출하는 과정이다 [S15].
웹 검색 확장 (Web Search Extension): 내부 지식 베이스만으로 답을 찾기 어려울 때 쿼리를 재작성하여 외부 웹 소스(Wikipedia 등)를 통해 지식을 보강하는 메커니즘이다 [S15].
신뢰도 기반 트리거 (Confidence Trigger): 검색 결과의 정밀도에 따라 '정제 후 사용', '웹 검색 대체', '병행 사용'의 최적 경로를 동적으로 선택하는 의사결정 로직이다 [S15].
🧩 추출된 패턴 (Extracted patterns)
Evaluate-then-Act Pattern: 검색된 정보를 LLM에 무비판적으로 전달하기 전, 반드시 평가자 레이어를 거쳐 데이터의 순도를 검증하는 패턴이다 [S15, S16].
Knowledge Strip Atomization: 문서를 단순 조각이 아닌 의미 있는 정보 단위(Strips)로 분해하여 관련성을 재평가함으로써 정보의 밀도를 극대화하는 정제 패턴이다 [S15].
Fallback to External Knowledge: 내부 데이터베이스의 한계(Incorrect 판정 시)를 감지하면 자동으로 외부 웹 검색을 수행하여 정보의 부재를 해결하는 회복 탄력성 패턴이다 [S15].
📖 세부 내용 (Details)
1. CRAG의 탄생 배경 및 목적 [S15]
전통적 RAG(Naive RAG)는 검색된 문서가 실제 질문과 관련이 낮더라도 LLM이 이를 그대로 수용해 환각(Hallucination)을 일으키는 치명적 약점이 있다. CRAG(Corrective RAG)는 2024년 1월 발표된 기술로, 검색된 정보의 순도를 시스템 스스로 검증하여 이러한 '무비판적 수용' 문제를 해결하는 것을 목적으로 한다.
2. 핵심 컴포넌트 작동 원리 [S15, S16]
검색 평가자 레이어: 1차 검색 결과에 대해 세 가지 상태로 분류한다.
Correct (정확): 관련성 높음. 문서를 '지식 스트립'으로 정제하여 답변 생성에 사용한다.
Incorrect (부정확): 관련성 없음. 내부 문서를 폐기하고 웹 검색으로 대체한다.
Ambiguous (애매): 확신 불가. 내부 문서 정제와 웹 검색 보강을 병행한다.
지식 정제 프로세스: 관련 문서를 더 작은 단위로 분해하고, 각 조각의 관련성을 다시 점수화하여 가장 핵심적인 내용만 선별한다. 이를 통해 LLM에 전달되는 컨텍스트의 노이즈를 제거한다.
쿼리 재작성 및 외부 검색: 내부 지식이 부족하다고 판단되면 사용자의 질문을 검색 엔진에 최적화된 형태로 재구성하여 외부 지식을 실시간으로 가져온다.
3. 주요 강점: 모듈화 [S15]
CRAG는 기존 RAG 파이프라인에 '평가자 레이어'만 플러그인(Plug-and-Play) 형태로 추가하면 되므로, 전체 시스템을 재구축할 필요 없이 점진적으로 성능을 개선할 수 있다는 설계상의 이점이 있다.
⚖️ 모순 및 업데이트 (Contradictions & updates)
비용 vs 신뢰성: 검색 결과가 모호(Ambiguous)할 때 내부 정제와 외부 검색을 병행하므로, 단선적인 RAG보다 LLM 호출 횟수와 API 비용, 응답 지연 시간(Latency)이 증가하는 트레이드오프가 발생한다 [S16].
검증의 주체: 원 논문에서는 T5-large 모델을 평가자로 제안했으나, 최근 실무에서는 GPT-4나 Claude와 같은 고성능 LLM을 평가자로 활용하는 추세로 업데이트되고 있다 [S15].
🛠️ 적용 사례 (Applied in summary)
학술 연구: arXiv:2401.15884 논문을 통해 기술적 실체가 증명되었으며, 짧은 형식 및 긴 형식의 답변 생성 작업 모두에서 정확도 향상이 확인되었다 [S16].
RAG 2.0 시스템: 기업용 입찰 문서 분석이나 과거 사업 검토 시스템에서 검색 품질의 불확실성을 제거하기 위한 검증 레이어로 적용되고 있다 [S15, S16].