[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
@@ -2,7 +2,7 @@
id: NLP-TF-IDF-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [ai, nlp, tf-idf, information-retrieval, text-mining, keyword-extraction, search-engine]
tags: [ai, nlp, tf-idf, information-retrieval, [[Text-Mining]], keyword-extraction, [[Search]]-engine]
last_reinforced: 2026-04-26
---
@@ -19,9 +19,9 @@ last_reinforced: 2026-04-26
- **의의:** 검색 엔진의 문서 랭킹, 텍스트 요약, 유사도 측정 등 초기 자연어 처리 및 정보 검색 기술의 가장 강력하고 직관적인 기초 도구.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단어의 순서나 맥락을 무시하는 'Bag-of-Words' 방식의 한계 때문에 딥러닝 임베딩(BERT 등)에 자리를 내주었으나, 여전히 키워드 기반 검색이나 데이터 전처리의 기준점(Baseline)으로서 압도적인 연산 효율성과 해석력을 제공함.
- **과거 데이터와의 충돌:** 단어의 순서나 맥락을 무시하는 'Bag-of-Words' 방식의 한계 때문에 딥러닝 임베딩([[BERT]] 등)에 자리를 내주었으나, 여전히 키워드 기반 검색이나 데이터 전처리의 기준점(Baseline)으로서 압도적인 연산 효율성과 해석력을 제공함.
- **정책 변화:** Antigravity 프로젝트는 1,174개 지식 문서의 초기 자동 분류 및 핵심 태그 추출 시, 연산 자원을 최소화하면서도 정확도가 높은 TF-IDF 알고리즘을 1차 필터링 엔진으로 활용함.
## 🔗 지식 연결 (Graph)
- [[Natural-Language-Processing-NLP]], [[Semantic-Search-with-AI]], [[Sparse-Data-Handling]], [[Similarity-Metrics-in-AI]]
- [[Natural-Language-[[Processing]]-NLP]], [[Semantic-Search-with-AI]], [[Sparse-Data-Handling]], [[Similarity-Metrics-in-AI]]
- **Raw Source:** 10_Wiki/Topics/AI/Term-Frequency-Inverse-Document-Frequency.md