Files
2nd/10_Wiki/Topics_GD/Hypothesis-Testing.md
T

2.3 KiB


id: MATH-HYPO-001 category: "10_Wiki/💡 Topics/AI" confidence_score: 1.0 tags: Statistics, math, hypothesis-Testing, p-value, data-science] last_reinforced: 2026-04-26

Hypothesis Testing (가설 검정)

📌 한 줄 통찰 (The Karpathy Summary)

"데이터의 증거를 토대로, 우리가 믿고 싶은 가설이 '우연'이라는 함정에 빠지지 않았는지 엄격하게 심판하라" — 표본 데이터를 통해 모집단의 특성에 대한 가설이 통계적으로 타당한지 계산하여, 의사결정의 불확실성을 수치화된 신뢰도로 치환하는 방법론.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: "귀무가설(Null Hypothesis)"이라는 기본 전제를 세우고, 관측된 데이터가 이 전제 하에서 발생할 확률(p-value)이 매우 낮다면 귀무가설을 기각하고 "대립가설(Alternative Hypothesis)"을 채택하는 논리적 추론 패턴.
  • 핵심 요소:
    • Null Hypothesis (H_0): 효과나 차이가 없다는 기본 가설.
    • Alternative Hypothesis (H_1): 증명하고 싶은 효과나 차이가 있다는 가설.
    • P-value: 귀무가설이 맞다는 전제 하에 현재 데이터가 관측될 확률. 보통 0.05 미만일 때 유의미하다고 판단.
    • Type I & II Error: 맞는데 틀리다고 하거나(Alpha), 틀린데 맞다고 하는(Beta) 오류의 관리.
  • 의의: 주관적인 판단을 배제하고, 객관적인 지표를 통해 변화의 실효성을 증명하는 데이터 과학의 근간.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: p-value에만 과도하게 의존하는 'P-hacking'의 위험성을 경고하며, 최근에는 효과 크기(Effect Size)와 베이지안 가설 검정을 병행하는 방향으로 정밀도 강화.
  • 정책 변화: Antigravity 프로젝트는 새로운 에이전트 알고리즘 도입 시, 기존 알고리즘과의 성능 차이를 가설 검정을 통해 통계적으로 증명한 후 배포를 결정하는 'Evidence-based Deployment' 원칙을 준수함.

🔗 지식 연결 (Graph)

  • Probability-Theory, Exploratory-Data-Analysis, A-B-Testing-Foundations, Decision-Making
  • Raw Source: 10_Wiki/Topics/AI/Hypothesis-Testing.md