docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -2,7 +2,7 @@
|
||||
id: NLP-TF-IDF-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, nlp, tf-idf, information-retrieval, [[Text-Mining]], keyword-extraction, [[Search]]-engine]
|
||||
tags: [ai, nlp, tf-idf, information-retrieval, [[Text-Mining|Text-Mining]], keyword-extraction, [[Search|Search]]-engine]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
@@ -19,9 +19,9 @@ last_reinforced: 2026-04-26
|
||||
- **의의:** 검색 엔진의 문서 랭킹, 텍스트 요약, 유사도 측정 등 초기 자연어 처리 및 정보 검색 기술의 가장 강력하고 직관적인 기초 도구.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단어의 순서나 맥락을 무시하는 'Bag-of-Words' 방식의 한계 때문에 딥러닝 임베딩([[BERT]] 등)에 자리를 내주었으나, 여전히 키워드 기반 검색이나 데이터 전처리의 기준점(Baseline)으로서 압도적인 연산 효율성과 해석력을 제공함.
|
||||
- **과거 데이터와의 충돌:** 단어의 순서나 맥락을 무시하는 'Bag-of-Words' 방식의 한계 때문에 딥러닝 임베딩([[BERT|BERT]] 등)에 자리를 내주었으나, 여전히 키워드 기반 검색이나 데이터 전처리의 기준점(Baseline)으로서 압도적인 연산 효율성과 해석력을 제공함.
|
||||
- **정책 변화:** Antigravity 프로젝트는 1,174개 지식 문서의 초기 자동 분류 및 핵심 태그 추출 시, 연산 자원을 최소화하면서도 정확도가 높은 TF-IDF 알고리즘을 1차 필터링 엔진으로 활용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Natural-Language-[[Processing]]-NLP]], [[Semantic-Search-with-AI]], [[Sparse-Data-Handling]], [[Similarity-Metrics-in-AI]]
|
||||
- [[Natural-Language-Processing|Natural-Language-[[Processing]]-NLP]], [[Semantic-Search-with-AI|Semantic-Search-with-AI]], [[Sparse-Data-Handling|Sparse-Data-Handling]], [[Similarity-Metrics-in-AI|Similarity-Metrics-in-AI]]
|
||||
- **Raw Source:** 10_Wiki/Topics/AI/Term-Frequency-Inverse-Document-Frequency.md
|
||||
|
||||
Reference in New Issue
Block a user