feat(wiki): 코드 그라운딩 23문서 + MOC 학습지도 39개

- 코드 그라운딩: 기술 주제 문서의 '적용 사례'에 실제 레포 구현 위치
  (file:line)+커밋 자동 주입 (예: 문서 청킹 전략→connectai/src/retrieval/chunker.ts).
  멱등 마커(CODE-GROUNDING)로 재실행 시 갱신.
- MOC: 39개 클러스터 폴더에 _MOC.md 학습지도 생성(진입점+통찰 주석).
도구: Datacollect/scripts/{code_grounding,moc_generator}.mjs

Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
This commit is contained in:
2026-06-08 18:56:11 +09:00
parent af11d666d2
commit 95cd8bb891
101 changed files with 11639 additions and 5 deletions
+9
View File
@@ -59,6 +59,15 @@ Re-ranking은 1차 검색(Recall)으로 확보된 다수의 후보 문서들을
- **세법 RAG 최적화:** 중복 조문이 많은 세법 데이터에서 MMR(다양성)과 Re-ranking을 조합하여 정답 배치 순서를 교정한 사례가 언급됨 [S32, S37].
- **Ensemble 구성:** 벡터 검색(k=4)과 BM25(k=4) 결과를 RRF로 합친 후, 필요 시 Re-ranker를 통해 최종 문맥을 선별하는 구조가 권장됨 [S34, S182].
<!-- CODE-GROUNDING:START -->
### 🔎 코드베이스 근거 (자동 추출 — E:\Wiki 레포)
**실제 구현/사용 위치:**
- `connectai/src/retrieval/semanticRerank.ts:2` — * LLM Semantic Re-ranking — TF-IDF / 임베딩이 놓치는 *의도* 매치를 작은 LLM 호출
_자동 생성: code_grounding.mjs · 재실행 시 갱신됨_
<!-- CODE-GROUNDING:END -->
## ✅ 검증 상태 및 신뢰도
- **상태:** draft
- **검증 단계:** conceptual