3.6 KiB
3.6 KiB
id, title, category, status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, tags, raw_sources, last_reinforced, github_commit, inferred_by
| id | title | category | status | canonical_id | aliases | duplicate_of | source_trust_level | confidence_score | tags | raw_sources | last_reinforced | github_commit | inferred_by | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| wiki-2026-0508-precision-recall-tradeoff | Precision Recall Tradeoff | 10_Wiki/Topics | needs_review | self |
|
none | A | 1.0 |
|
2026-04-26 | pending | Claude Opus 4.7 (auto-normalize 2026-05-08) |
Precision-Recall Tradeoff (정밀도-재현율 트레이드오프)
📌 한 줄 통찰 (The Karpathy Summary)
"오답을 내지 않는 '신중함'과 정답을 놓치지 않는 '집요함' 사이에서, 비즈니스의 가치를 극대화하는 중도의 임계점을 사수하라" — 정밀도와 재현율 중 하나를 높이면 다른 하나는 낮아지는 상충 관계를 이해하고, 문제의 성격에 따라 최적의 균형점을 선택하는 전략적 의사결정 원리.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: "Decision Threshold and Performance Balancing" — 모델의 분류 임계값(Threshold)을 높이면 확실한 것만 정답이라 하므로 정밀도가 올라가지만(신중), 임계값을 낮추면 더 많은 가능성을 정답으로 포함시켜 재현율이 올라가는(집요) 상보적 패턴.
- 주요 고려 사항:
- High Precision Priority: 스팸 메일 분류처럼 오탐(FP)의 피해가 클 때 선택.
- High Recall Priority: 암 진단이나 사기 탐지처럼 미탐(FN)의 위험이 치명적일 때 선택.
- F1-Score: 두 지표의 조화 평균으로, 어느 한쪽에 치우치지 않는 균형 잡린 성능 평가.
- 의의: 100% 완벽한 모델은 존재하지 않음을 인정하고, 한정된 자원 내에서 '틀렸을 때의 비용'을 최소화하는 공학적 최적화를 가능케 함.
⚠️ 모순 및 업데이트 (Contradictions & Updates)
- 과거 데이터와의 충돌: 단순히 두 지표가 높을수록 좋다는 단편적 시각에서 벗어나, 이제는 PR 곡선(Precision-Recall Curve)의 면적(AUC)을 분석하여 모델의 전체적인 변별력을 다각도로 검증함.
- 정책 변화: Antigravity 프로젝트는 에이전트의 지식 추출 작업 시, 잘못된 지식을 포함하지 않기 위해 정밀도(Precision)를 우선시하는 임계값 설정을 기본으로 하되, 탐색 모드에서는 재현율을 높여 더 많은 연결 고리를 찾도록 가변적으로 운용함.
🔗 지식 연결 (Graph)
- Performance-Metrics-in-AI, Imbalanced-Data-Handling, Loss-Functions-Foundations, Exploratory-Data-Analysis
- Raw Source: 10_Wiki/Topics/AI/Precision-Recall-Tradeoff.md
🤖 LLM 활용 힌트 (How to Use This Knowledge)
언제 이 지식을 쓰는가:
- (TODO)
언제 쓰면 안 되는가:
- (TODO)
🧪 검증 상태 (Validation)
- 정보 상태: needs_review
- 출처 신뢰도: A
- 검토 이유: (P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)
🧬 중복 검사 (Duplicate Check)
- 기존 유사 문서: (TODO: 인덱서 클러스터 리포트 참조)
- 처리 방식: UPDATE (자동 정규화)
- 처리 이유: Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
🕓 변경 이력 (Changelog)
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|---|---|---|---|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |