34 lines
2.6 KiB
Markdown
34 lines
2.6 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-SADA-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.98
|
|
tags: [auto-reinforced, statistics, data-analysis, hypothesis-testing, data-science]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Statistics & Data Analysis|Statistics & Data Analysis]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "데이터의 노이즈를 뚫고 진실을 보는 눈: 불확실성 가득한 세상의 숫자들을 수집, 정리, 분석하여 보이지 않는 패턴을 발견하고 논리적인 의사결정의 근거를 마련하는 지적 무기."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
통계 및 데이터 분석(Statistics & Data Analysis)은 데이터를 통해 현상을 이해하고 추론하여 가치 있는 통찰(Insight)을 도출하는 과학적 방법론입니다.
|
|
|
|
1. **3대 분석 영역**:
|
|
* **Descriptive (기술 통계)**: 데이터를 요약하고 특성을 묘사 (평균, 표준편차, 분포 등).
|
|
* **Inferential (추론 통계)**: 표본을 통해 모집단의 성질을 추측하고 가설을 검정 (P-value, 신뢰구간).
|
|
* **Predictive (예측 분석)**: 과거 데이터를 바탕으로 머신러닝 등을 활용해 미래 결과 예측.
|
|
2. **핵심 워크플로우**:
|
|
* 질문 정의 -> 데이터 수집 -> 전처리(Cleaning) -> 탐색적 분석(EDA) -> 모델링 -> 결과 해석 및 시각화.
|
|
3. **데이터 사이언스와의 관계**:
|
|
* 통계학은 뿌리이며, 여기에 컴퓨터 공학의 연산력과 도메인 지식이 결합되어 현대의 데이터 사이언스가 됨.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 작은 표본(Sample)을 통한 추론이 중요했으나, 현대 정책은 'Big Data' 전체를 다루는 계산 통계학과, 상관관계 너머의 원인을 찾는 '인과 추론(Causal Inference)' 정책으로 패러다임이 이동함(RL Update).
|
|
- **정책 변화(RL Update)**: '데이터 기반 의사결정(Data-Driven Decision Making)'이 모든 공공 및 민간 정책의 기본 요건으로 규정됨에 따라, 분석 결과의 재현성(Reproducibility)과 투명성을 확보하기 위한 '데이터 신뢰성 검증 표준' 수립이 시급한 정책 과제가 됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Probability Theory|Probability Theory]], [[Quantitative Economics (수량경제학)|Quantitative Economics (수량경제학)]], [[Sensitivity-Analysis|Sensitivity-Analysis]], [[Signal in Noise|Signal in Noise]], Philosophy of Science
|
|
- **Modern Tech/Tools**: R, Python (Pandas/Scipy), Tableau, Google BigQuery.
|
|
---
|