2nd/10_Wiki/Topics_Blog/Hypothesis-Testing.md

---
id: MATH-HYPO-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [statistics, math, hypothesis-testing, p-value, data-science]
last_reinforced: 2026-04-26
---

# Hypothesis Testing (가설 검정)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 증거를 토대로, 우리가 믿고 싶은 가설이 '우연'이라는 함정에 빠지지 않았는지 엄격하게 심판하라" — 표본 데이터를 통해 모집단의 특성에 대한 가설이 통계적으로 타당한지 계산하여, 의사결정의 불확실성을 수치화된 신뢰도로 치환하는 방법론.

## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "귀무가설(Null Hypothesis)"이라는 기본 전제를 세우고, 관측된 데이터가 이 전제 하에서 발생할 확률(p-value)이 매우 낮다면 귀무가설을 기각하고 "대립가설(Alternative Hypothesis)"을 채택하는 논리적 추론 패턴.
- **핵심 요소:**
    - **Null Hypothesis ($H_0$):** 효과나 차이가 없다는 기본 가설.
    - **Alternative Hypothesis ($H_1$):** 증명하고 싶은 효과나 차이가 있다는 가설.
    - **P-value:** 귀무가설이 맞다는 전제 하에 현재 데이터가 관측될 확률. 보통 0.05 미만일 때 유의미하다고 판단.
    - **Type I & II Error:** 맞는데 틀리다고 하거나(Alpha), 틀린데 맞다고 하는(Beta) 오류의 관리.
- **의의:** 주관적인 판단을 배제하고, 객관적인 지표를 통해 변화의 실효성을 증명하는 데이터 과학의 근간.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** p-value에만 과도하게 의존하는 'P-hacking'의 위험성을 경고하며, 최근에는 효과 크기(Effect Size)와 베이지안 가설 검정을 병행하는 방향으로 정밀도 강화.
- **정책 변화:** Antigravity 프로젝트는 새로운 에이전트 알고리즘 도입 시, 기존 알고리즘과의 성능 차이를 가설 검정을 통해 통계적으로 증명한 후 배포를 결정하는 'Evidence-based Deployment' 원칙을 준수함.

## 🔗 지식 연결 (Graph)
- Probability-Theory, [[Exploratory-Data-Analysis]], A-B-Testing-Foundations, Decision-Making
- **Raw Source:** 10_Wiki/Topics/AI/Hypothesis-Testing.md