--- id: DATA-ORD-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [statistics, data-analysis, ordinal-data, categorical-data, machine-learning, feature-engineering] last_reinforced: 2026-04-26 --- # Ordinal Data Analysis (μˆœμ„œν˜• 데이터 뢄석) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "데이터 μ‚¬μ΄μ˜ μƒλŒ€μ μΈ 'μˆœμ„œ'와 '계측'을 λ³΄μ‘΄ν•˜λ˜, κ·Έ 간격이 μΌμ •ν•˜μ§€ μ•ŠμŒμ„ μΈμ •ν•˜λ©° 톡계적 μ§ˆμ„œλ₯Ό μ„Έμš°λΌ" β€” λ²”μ£Ό(Category)λ“€ 사이에 λͺ…ν™•ν•œ μˆœμœ„λ‚˜ 등급이 μ‘΄μž¬ν•˜μ§€λ§Œ, 각 단계 μ‚¬μ΄μ˜ 수치적 거리가 μΌμ •ν•˜μ§€ μ•Šμ€ 데이터λ₯Ό λΆ„μ„ν•˜κ³  μ²˜λ¦¬ν•˜λŠ” 톡계적 방법둠. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Order-preserving Encoding and Rank Statistics" β€” '맀우 만쑱(5), 만쑱(4), 보톡(3)...'κ³Ό 같이 μˆœμ„œ 정보가 μ€‘μš”ν•œ 데이터λ₯Ό μ²˜λ¦¬ν•  λ•Œ, λ‹¨μˆœ λ²”μ£Όν˜•μœΌλ‘œ μ·¨κΈ‰ν•˜μ—¬ μˆœμ„œλ₯Ό μžƒμ§€ μ•ŠμœΌλ©΄μ„œλ„ μˆ˜μΉ˜ν˜•μ²˜λŸΌ 거리 연산을 μ˜€μš©ν•˜μ§€ μ•Šλ„λ‘ μˆœμœ„ 기반의 톡계 기법(Spearman's Rho λ“±)μ΄λ‚˜ μ„œμ—΄ 인코딩(Ordinal Encoding)을 μ μš©ν•˜λŠ” νŒ¨ν„΄. - **μ£Όμš” νŠΉμ§•:** - **Relative Ranking:** μˆœμ„œ 관계($1 < 2 < 3$)λŠ” λͺ…확함. - **Variable Intervals:** $2-1$의 μ˜λ―Έμ™€ $3-2$의 μ˜λ―Έκ°€ μˆ˜ν•™μ μœΌλ‘œ λ™μΌν•˜μ§€ μ•ŠμŒ. - **의의:** 고객 λ§Œμ‘±λ„ 쑰사, μ‹ μš© λ“±κΈ‰ λΆ„λ₯˜, μ§ˆλ³‘μ˜ 쀑증도 단계 λ“± μ‹€μƒν™œμ—μ„œ ν”νžˆ μ ‘ν•˜λŠ” 계측적 정보λ₯Ό AI λͺ¨λΈμ΄ μ™œκ³‘ 없이 ν•™μŠ΅ν•˜κ²Œ ν•˜λŠ” ν•„μˆ˜ μ „μ²˜λ¦¬ 지식. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** μˆœμ„œν˜• 데이터λ₯Ό λ‹¨μˆœνžˆ μˆ˜μΉ˜ν˜•μœΌλ‘œ λ³€ν™˜ν•˜μ—¬ 평균을 λ‚΄λŠ” 였λ₯˜λ₯Ό λ²”ν•˜κΈ° μ‰¬μš°λ‚˜, ν˜„λŒ€ λΆ„μ„μ—μ„œλŠ” λˆ„μ  λ‘œμ§“ λͺ¨λΈ(Cumulative Logit Model) 등을 μ‚¬μš©ν•˜μ—¬ μˆœμ„œν˜• λ°μ΄ν„°μ˜ 본질적 νŠΉμ„±μ„ λ³΄μ‘΄ν•˜λŠ” λͺ¨λΈλ§μ„ μˆ˜ν–‰ν•¨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” μ—μ΄μ „νŠΈμ˜ μž‘μ—… 결과에 λŒ€ν•œ μ‚¬μš©μž ν”Όλ“œλ°±(1~5점 척도)을 뢄석할 λ•Œ, μ‚°μˆ  ν‰κ· λΏλ§Œ μ•„λ‹ˆλΌ μˆœμœ„ 기반의 뢄포 뢄석을 λ³‘ν–‰ν•˜μ—¬ μ •κ΅ν•œ μ„±λŠ₯ κ°œμ„  μ§€ν‘œλ₯Ό λ„μΆœν•¨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Pre-processing-Data-for-AI]], [[One-Hot-Encoding]], [[Exploratory-Data-Analysis]], Feature-Engineering-Best-Practices - **Raw Source:** 10_Wiki/Topics/AI/Ordinal-Data-Analysis.md