Files
2nd/10_Wiki/Topics_Rag/RAG 아키텍처 및 파이프라인 기초.md
T
koriweb 95cd8bb891 feat(wiki): 코드 그라운딩 23문서 + MOC 학습지도 39개
- 코드 그라운딩: 기술 주제 문서의 '적용 사례'에 실제 레포 구현 위치
  (file:line)+커밋 자동 주입 (예: 문서 청킹 전략→connectai/src/retrieval/chunker.ts).
  멱등 마커(CODE-GROUNDING)로 재실행 시 갱신.
- MOC: 39개 클러스터 폴더에 _MOC.md 학습지도 생성(진입점+통찰 주석).
도구: Datacollect/scripts/{code_grounding,moc_generator}.mjs

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-08 18:56:11 +09:00

11 KiB

id, title, category, status, verification_status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, created_at, updated_at, review_reason, merge_history, tags, raw_sources, applied_in, github_commit
id title category status verification_status canonical_id aliases duplicate_of source_trust_level confidence_score created_at updated_at review_reason merge_history tags raw_sources applied_in github_commit
rag-아키텍처-및-파이프라인-기초 RAG 아키텍처 및 파이프라인 기초 AI_and_ML draft conceptual
Retrieval-Augmented Generation
검색 증강 생성
RAG Pipeline
RAG Architecture
Naive RAG
Advanced RAG
A 0.95 2026-06-08 2026-06-08
research
RAG
LLM
Architecture
Pipeline
1. RAG 파이프라인 기초 아키텍처
RAG Architecture: 4 Key Components & Example Implementation - Cloudian
RAG Pipeline - velog
RAG 구축하기 - 3.2 성능 최적화 : Hybrid Search(CC& RRF) 와 Rerank
RAG 기반 AI 서비스의 신뢰성을 확보하는 방법: 자동화 평가 체계 및 운영 최적화
RAG 기술의 진화: Naive에서 Modular까지 총정리 - 슈퍼브 블로그
RAG 솔루션 디자인 및 개발 - Azure Architecture Center - Microsoft Learn
RAG의 진화: GraphRAG, Agentic RAG, CRAG의 등장 - CSLEE Tech Blog %
[Tech Series] kt cloud AI 검색 증강 생성(RAG) #2 : 데이터 파싱과 전처리 최적화
기업용 RAG 시스템 보안 설계 방법, 핵심은 '외부 지식 통제' - 알체라
01_RAG_파이프라인_기초_아키텍처.ipynb
01_RAG_파이프라인_기초_아키텍처.md
RAG 실험 가속기 GitHub 리포지토리

RAG 아키텍처 및 파이프라인 기초

🎯 한 줄 통찰 (One-line insight)

RAG는 LLM의 정적 지식 한계와 환각을 극복하기 위해 외부 지식 베이스를 검색(Retrieval)하여 생성(Generation) 과정에 실시간으로 결합하는 고정밀 지식 보강 프레임워크이다 [S9, S108, S154].

🧠 핵심 개념 (Core concepts)

  • Retriever (검색기): 사용자 질의를 바탕으로 외부 지식 코퍼스에서 의미적으로 가장 관련 있는 정보를 찾아내는 컴포넌트이다 [S109, S155, S158].
  • Generator (생성기): 검색된 컨텍스트와 원래의 질문을 결합하여 근거(Grounding)에 기반한 답변을 생성하는 LLM이다 [S109, S113, S159].
  • Vector Database: 텍스트를 고차원 벡터로 변환(Embedding)하여 저장하고, 유사도 검색(Similarity Search)을 수행하는 저장소이다 [S28, S116, S183].
  • Knowledge Base: LLM의 학습 데이터와 분리된 기업 내부 문서, 최신 정보 등의 외부 데이터 집합이다 [S109, S114, S160].

🧩 추출된 패턴 (Extracted patterns)

  • Two-Stage Pipeline: 오프라인에서 데이터를 준비하는 '인덱싱 단계'와 온라인에서 답변을 생성하는 '검색 및 생성 단계'로 명확히 구분된다 [S13, S58, S204].
  • Retrieve-then-Rerank: 1차 벡터 검색(Recall 중심) 후 Re-ranker 모델을 통한 2차 정밀 정렬(Precision 중심)을 수행하여 정확도를 극대화한다 [S11, S191, S198].
  • Hybrid Search Pattern: 의미 기반의 Dense Search와 키워드 기반의 Sparse Search(BM25) 결과를 RRF(Reciprocal Rank Fusion) 알고리즘으로 병합하여 검색 품질을 보완한다 [S12, S182, S193].
  • Modular Design: 로더, 청커, 임베딩, 검색기 등을 레고 블록처럼 독립적인 모듈로 설계하여 유연한 교체와 확장을 가능케 한다 [S12, S239, S250].

📖 세부 내용 (Details)

1. RAG 파이프라인의 7단계 구조 [S8, S53]

  1. 문서 로딩 (Loading): PDF, HTML, DB 등 다양한 포맷의 원본 데이터를 시스템이 처리할 수 있는 Document 객체로 변환한다 [S14, S59].
  2. 청킹 (Chunking): 문서를 LLM의 컨텍스트 제한과 검색 효율에 맞춰 작은 단위로 분할한다. 재귀적 분할(Recursive), 시맨틱 분할 등이 활용된다 [S16, S61].
  3. 임베딩 (Embedding): 분할된 텍스트 청크를 고차원 수치 벡터로 변환하여 의미적 비교가 가능하게 한다 [S23, S68].
  4. 벡터 DB 저장: 임베딩된 벡터와 메타데이터를 효율적으로 저장하고 인덱싱한다 [S28, S73].
  5. 검색 (Retrieval): 질문과 유사한 상위 K개의 청크를 추출한다. 유사도 점수 임계값을 설정하여 관련성 낮은 결과를 걸러내기도 한다 [S29, S74, S77].
  6. 질의 변환 (Query Transformation): 검색 품질을 높이기 위해 질문을 재구성(HyDE, 질의 분해 등)한다 [S10, S55, S82].
  7. 컨텍스트 구성 및 생성: 검색된 문서를 프롬프트에 삽입(Stuff, Map-Reduce 등)하여 LLM이 최종 답변을 생성하게 한다 [S40, S85].

2. RAG의 진화 단계 [S9, S54, S234]

  • Naive RAG: 질의 → 검색 → 생성의 가장 단순한 흐름으로, 구현은 쉽지만 복잡한 질의 대응력이 낮다 [S10, S236, S275].
  • Advanced RAG: 전처리(질의 변환)와 후처리(Re-ranking)를 강화하고 하이브리드 검색을 도입하여 성능을 개선한다 [S10, S237, S248].
  • Modular RAG: 각 단계를 독립 모듈화하고, 검색 결과에 따라 웹 검색을 수행하는 등 동적인 워크플로우를 제공한다 [S12, S239, S250].

3. 평가 체계: RAG Triad [S217, S226]

RAG 시스템의 신뢰성 확보를 위해 다음 세 가지 지표로 품질을 관리한다 (RAGAS 프레임워크):

  • Context Precision: 검색된 문서 중 실제 답변에 필요한 정보의 비율과 상단 노출 정확도를 측정한다.
  • Faithfulness (충실성): 생성된 답변이 제공된 컨텍스트에만 근거하는지(환각 여부) 평가한다.
  • Answer Relevance: 답변이 사용자의 질문 의도와 의미적으로 일치하는지 측정한다.

⚖️ 모순 및 업데이트 (Contradictions & updates)

  • RAG vs Fine-tuning: RAG는 최신 정보 업데이트와 출처 추적에 유리하며, Fine-tuning은 특정 말투나 특수한 출력 형식을 학습시키는 데 적합하다 [S13, S58, S111]. 두 기법은 상호 배타적이지 않으며 병행 사용이 가능하다 [S13].
  • 벡터 검색의 한계: 단순 벡터 유사도는 숫자, 고유명사, 법률 조항 번호 검색에 약하며, 이를 보완하기 위해 반드시 키워드 기반 Sparse Search를 결합한 하이브리드 방식이 권장된다 [S12, S192, S205].

🛠️ 적용 사례 (Applied in summary)

  • 코드 및 실습: 01_RAG_파이프라인_기초_아키텍처.ipynb.md 파일에서 기초 아키텍처 구현 사례가 발견된다 [S9, S54].
  • 최적화 도구: Azure AI Search와 LangChain을 활용한 오케스트레이션 설계 및 'RAG 실험 가속기' GitHub 리포지토리를 통한 실험적 적용이 기술되어 있다 [S259, S261].
  • 산업 도메인: 금융(재고 관리), 법률(보험 약관), 의료기관 등 정확성이 생명인 분야에서 데이터 접근 제어(RBAC/ABAC)를 포함한 보안 RAG 설계가 적용되고 있다 [S306, S403, S412].

검증 상태 및 신뢰도

  • 상태: draft
  • 검증 단계: conceptual
  • 출처 신뢰도: A (Microsoft, Azure, kt cloud 등 기술 블로그 및 공식 문서 기반)
  • 신뢰 점수: 0.95
  • 중복 검사 결과: 신규 생성 (New discovery)

상위/유사 개념

[기반 기술 및 아키텍처]

  • 텍스트 임베딩 모델
    • 연결 이유: RAG의 의미 검색 성능은 임베딩 모델의 품질에 직접 의존함 [S184].
  • 벡터 데이터베이스
    • 연결 이유: 대규모 데이터셋에서 고속 유사도 검색을 수행하는 핵심 저장 인프라 [S28, S221].
  • Advanced RAG 기법
    • 연결 이유: Naive RAG의 한계를 극복하기 위한 질의 변환 및 Re-ranking 기술 [S10, S191].

[진화된 형태]

  • Agentic RAG
    • 연결 이유: 에이전트가 스스로 검색 전략을 수립하고 실행하는 차세대 RAG [S280, S293].
  • GraphRAG
    • 연결 이유: 개체 간 관계를 지식 그래프로 구조화하여 복합적인 질문에 대응 [S276, S289].

심층 후속 질문 (Deeper Research Questions)

  • 임베딩 모델의 최대 토큰 제한과 청킹 전략 사이의 상관관계는 실제 검색 정확도에 어떤 영향을 미치는가? [S26, S71]
  • Re-ranker 도입 시 발생하는 추가 지연 시간(Latency)을 프로덕션 환경에서 어떻게 최적화할 것인가? [S197, S210]
  • 시맨틱 캐싱(Semantic Caching)의 임계값(Threshold) 설정이 비용 절감과 답변의 최신성 사이에서 어떤 트레이드오프를 만드는가? [S222, S231]
  • 개인정보 보호를 위한 마스킹 파이프라인이 임베딩 벡터의 의미 보존력을 얼마나 약화시키는가? [S331, S382]
  • RRF 알고리즘에서 파라미터 k값이 하이브리드 검색 결과의 순위 안정성에 미치는 영향은 무엇인가? [S193, S206]

실무 적용 맥락 (Practical Application Contexts)

  • Implementation: LangChain 또는 LlamaIndex를 오케스트레이터로 사용하여 파이프라인 구성 [S220, S229].
  • System Design: 실시간성을 위해 Kafka/Flink 기반 스트리밍 파싱 도입 고려 [S333, S384].
  • Operation / Maintenance: RAGAS 지표를 모니터링 대시보드(Arize Phoenix 등)에 연결하여 품질 지속 관리 [S221, S230].
  • Learning Path: Naive RAG 구축 → 하이브리드 검색 도입 → Re-ranking 추가 → 평가 자동화 순으로 학습 권장 [S1, S45].

인접 주변 주제

  • LLMOps
    • 확장 방향: RAG 시스템을 단순 개발을 넘어 데이터 기반의 지속적 운영 대상으로 관리하는 체계 [S217, S226].

🔗 지식 그래프 (Knowledge Graph)

📚 출처 (Sources)

  • [S1] 1. RAG 파이프라인 기초 아키텍처 (devspoon)
  • [S9] RAG 개요 및 유형 분류 (devspoon)
  • [S13] RAG vs Fine-tuning 및 전체 흐름 (devspoon)
  • [S28] 벡터 데이터베이스 비교 (devspoon)
  • [S108] RAG 정의 및 기본 컴포넌트 (Cloudian)
  • [S183] RAG 세부 구성도 및 흐름 (velog)
  • [S191] Hybrid Search와 Re-Rank 기법 (hjjummy)
  • [S217] RAGAS 프레임워크와 RAG Triad (교보DTS)
  • [S234] RAG 기술의 진화 개요 (슈퍼브 블로그)
  • [S260] Azure RAG 데이터 파이프라인 흐름 (Microsoft Learn)
  • [S280] Agentic RAG 작동 원리 (CSLEE Tech Blog)
  • [S303] GIGO 원칙과 파싱 품질 (kt cloud)
  • [S404] RAG 보안 및 접근 제어 (알체라)

📝 변경 이력 (Change history)

  • 2026-06-08: Initial draft generated via Datacollector_MAC P-Reinforce engine.