"매 data 의 lying 의 — 매 stats 의 catching". Statistics 의 uncertainty 의 quantify 의, 매 patterns 의 noise 의 separate 의 의 discipline. 2026 의 production 의 standard 의: Bayesian methods (PyMC, Stan), causal inference (DoWhy, EconML), CUPED 의 A/B test variance reduction.
매 핵심
매 핵심 dichotomy
Frequentist: p-values, confidence intervals — 매 long-run frequency 의.
Bayesian: posteriors, credible intervals — 매 belief update 의.
2026 trend: Bayesian 의 production analytics 의 dominant (interpretable, sequential-safe).
언제: experiment design review, p-value 해석, choosing test for distribution shape, generating PyMC models from descriptions.
언제 X: trusting LLM-computed p-values 없이 의 verification — 매 arithmetic mistakes.
❌ 안티패턴
Peeking: 매 fixed-N test 의 daily check 의 stop — 매 false positive rate 의 5% → 30%+.
HARKing: 매 hypothesis after results known.
p<0.05 worship: 매 effect size 무시.
Ignoring multiple testing: 매 20 metrics 의 →약 1 의 false positive 의 expected.
CUPED 의 covariate 의 post-treatment 의: 매 invalidates.
🧪 검증 / 중복
Verified (Microsoft CUPED paper 2013, Optimizely Stats Engine, Gelman BDA3, Wasserman All of Stats).