Wiki cleanup: error-doc removal, dedup merge, link normalization

10_Wiki/Topics 대규모 정리:
- 오류 캡처/미완성 stub 문서 227개 제거
- 교차폴더 중복 43클러스터 병합 (63파일 → redirect)
- 링크명 정규화: 깨진 링크 수정·redirect 직결·개념 매핑 ~2,400건
- 카테고리 MOC 6개 신규 생성
- Graph 섹션 미해결 related-keyword 링크 10,058건 제거

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
Antigravity Agent
2026-05-20 23:52:15 +09:00
parent 2a4a5046b6
commit f8b21af4be
2874 changed files with 15296 additions and 27684 deletions
+4 -4
View File
@@ -160,10 +160,10 @@ print(lan.stem("organic")) # 'org' — 매 false conflation
**기본값**: 매 Snowball (English/multi-lang) + spaCy lemmatizer (POS 가 중요한 경우). 매 dense retrieval 시 stemming X.
## 🔗 Graph
- 부모: [[NLP-Preprocessing]] · [[Information-Retrieval]]
- 변형: [[Lemmatization]] · [[Tokenization]] · [[BPE]] · [[SentencePiece]]
- 응용: [[BM25]] · [[Elasticsearch]] · [[SPLADE]] · [[TF-IDF]]
- Adjacent: [[Morphological-Analysis]] · [[Korean-NLP]]
- 부모: [[Information-Retrieval]]
- 변형: [[Tokenization]] · [[BPE]] · [[SentencePiece]]
- 응용: [[BM25]] · [[Elasticsearch]] · [[TF-IDF]]
- Adjacent: [[Morphological-Analysis]]
## 🤖 LLM 활용
**언제**: 매 legacy IR pipeline, hybrid (sparse+dense) retrieval 의 sparse leg, domain-specific keyword expansion (legal/medical).