Files
2nd/10_Wiki/Topics_Blog/Standard-Deviation-and-Variance.md
T

2.4 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
MATH-STAT-VAR-001 10_Wiki/💡 Topics/AI 1.0
math
statistics
standard-deviation
variance
dispersion
data-analysis
normal-distribution
2026-04-26

Standard Deviation and Variance (표준 편차 및 분산)

📌 한 줄 통찰 (The Karpathy Summary)

"평균이라는 중심에서 데이터가 얼마나 멀리 방황하는지 '거리의 평균'으로 측정하여, 집단의 변동성과 불확실성을 수치라는 명확한 잣대로 정의하라" — 데이터의 흩어짐(산포도)을 나타내는 가장 핵심적인 통계 지표.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: "Squared Deviation Averaging and Dimensional Normalization" — 개별 데이터와 평균의 차이를 제곱하여 모두 더함으로써 편차의 합이 0이 되는 문제를 해결하고(Variance), 여기에 다시 제곱근을 취해 원본 데이터와 단위를 맞춤으로써 해석력을 확보하는 패턴.
  • 핵심 개념:
    • Variance (\sigma^2): 데이터가 평균에서 떨어진 거리의 제곱 평균. 변동성의 총량.
    • Standard Deviation (\sigma): 분산의 제곱근. 데이터의 평균적인 이탈 거리.
    • 68-95-99.7 Rule: 정규 분포에서 표준 편차의 배수에 따라 데이터가 포함될 확률 정의.
  • 의의: 데이터의 안정성을 평가하고, 이상치(Outlier)를 판별하며, 모델의 예측 오차나 금융 시장의 변동성(Risk)을 측정하는 모든 데이터 과학의 절대적 기초.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 평균 중심의 분석이 전부라 믿던 시대에서 벗어나, 이제는 평균이 같더라도 표준 편차가 큰 '두터운 꼬리(Fat Tail)' 데이터가 실전 비즈니스(예: 블랙 스완 사건)에서 훨씬 더 위험하고 중요하다는 인식이 확산됨.
  • 정책 변화: Antigravity 프로젝트는 에이전트의 응답 시간(Latency) 관리 시, 평균값뿐만 아니라 표준 편차를 상시 모니터링하여 서비스 경험의 일관성(Consistency)을 엄격히 관리함.

🔗 지식 연결 (Graph)