Files
2nd/10_Wiki/Topics_Dev/Statistics & Data Analysis.md
T

34 lines
2.6 KiB
Markdown

---
id: [[P-Reinforce|P-Reinforce]]-AUTO-SADA-001
category: Dev
confidence_score: 0.98
tags: [auto-reinforced, [[Statistics|Statistics]], data-[[Analysis|Analysis]], [[Hypothesis-Testing|Hypothesis-Testing]], data-science]
last_reinforced: 2026-04-20
---
# [[Statistics & Data Analysis|Statistics & Data Analysis]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 노이즈를 뚫고 진실을 보는 눈: 불확실성 가득한 세상의 숫자들을 수집, 정리, 분석하여 보이지 않는 패턴을 발견하고 논리적인 의사결정의 근거를 마련하는 지적 무기."
## 📖 구조화된 지식 (Synthesized Content)
통계 및 데이터 분석(Statistics & Data Analysis)은 데이터를 통해 현상을 이해하고 추론하여 가치 있는 통찰(Insight)을 도출하는 과학적 방법론입니다.
1. **3대 분석 영역**:
* **Descriptive (기술 통계)**: 데이터를 요약하고 특성을 묘사 (평균, 표준편차, 분포 등).
* **Inferential (추론 통계)**: 표본을 통해 모집단의 성질을 추측하고 가설을 검정 (P-value, 신뢰구간).
* **Predictive (예측 분석)**: 과거 데이터를 바탕으로 머신러닝 등을 활용해 미래 결과 예측.
2. **핵심 워크플로우**:
* 질문 정의 -> 데이터 수집 -> 전처리(Cleaning) -> 탐색적 분석(EDA) -> 모델링 -> 결과 해석 및 시각화.
3. **데이터 사이언스와의 관계**:
* 통계학은 뿌리이며, 여기에 컴퓨터 공학의 연산력과 도메인 지식이 결합되어 현대의 데이터 사이언스가 됨.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 작은 표본(Sample)을 통한 추론이 중요했으나, 현대 정책은 'Big Data' 전체를 다루는 계산 통계학과, 상관관계 너머의 원인을 찾는 '인과 추론(Causal Inference)' 정책으로 패러다임이 이동함(RL Update).
- **정책 변화(RL Update)**: '데이터 기반 의사결정(Data-Driven Decision Making)'이 모든 공공 및 민간 정책의 기본 요건으로 규정됨에 따라, 분석 결과의 재현성(Reproducibility)과 투명성을 확보하기 위한 '데이터 신뢰성 검증 표준' 수립이 시급한 정책 과제가 됨.
## 🔗 지식 연결 (Graph)
- [[Probability Theory|Probability Theory]], [[Quantitative Economics (수량경제학)|Quantitative Economics (수량경제학)]], [[Sensitivity-Analysis|Sensitivity-Analysis]], [[Signal in Noise|Signal in Noise]], [[Philosophy|Philosophy]] of Science
- **Modern Tech/Tools**: R, Python (Pandas/Scipy), Tableau, Google BigQuery.
---