--- id: SYS-SHARD-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [database, systems, scalability, sharding, partitioning, distributed-systems, big-data] last_reinforced: 2026-04-26 --- # Sharding and Partitioning (샀딩 및 νŒŒν‹°μ…”λ‹) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "κ±°λŒ€ν•œ μ§€μ‹μ˜ 덩어리λ₯Ό μ „λž΅μ μΈ κΈ°μ€€(Key)에 따라 쑰각내어 λΆ„μ‚°ν•˜κ³ , 병렬 처리λ₯Ό 톡해 단일 μ„œλ²„μ˜ ν•œκ³„λ₯Ό λ„˜μ–΄ λ¬΄ν•œν•œ ν™•μž₯의 길을 열어라" β€” λŒ€κ·œλͺ¨ 데이터λ₯Ό 효율적으둜 κ΄€λ¦¬ν•˜κΈ° μœ„ν•΄ λ°μ΄ν„°λ² μ΄μŠ€λ₯Ό μˆ˜ν‰μ  ν˜Ήμ€ 수직적으둜 λΆ„ν• ν•˜μ—¬ μ €μž₯ν•˜κ³  μ²˜λ¦¬ν•˜λŠ” μ΅œμ ν™” 기법. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Data Fragmentation and Distributed Load Balancing" β€” ν•˜λ‚˜μ˜ κ±°λŒ€ν•œ ν…Œμ΄λΈ”μ„ μ—¬λŸ¬ μ„œλ²„(Sharding)λ‚˜ 동일 μ„œλ²„ λ‚΄ μ—¬λŸ¬ 논리적 λ‹¨μœ„(Partitioning)둜 μͺΌκ°œμ–΄, 전체 데이터λ₯Ό μ‘°νšŒν•˜μ§€ μ•Šκ³  ν•„μš”ν•œ μ‘°κ°μ—λ§Œ μ ‘κ·Όν•˜μ—¬ 응닡 속도λ₯Ό λΉ„μ•½μ μœΌλ‘œ λ†’μ΄λŠ” νŒ¨ν„΄. - **핡심 ꡬ뢄:** - **Vertical Partitioning:** ν…Œμ΄λΈ”μ˜ μ»¬λŸΌμ„ κΈ°μ€€μœΌλ‘œ μͺΌκ°œκΈ°. 자주 μ“°μ΄λŠ” 데이터와 μ•„λ‹Œ 데이터λ₯Ό 뢄리. - **Horizontal Partitioning (Sharding):** ν–‰(Row)을 κΈ°μ€€μœΌλ‘œ μͺΌκ°œμ–΄ μ„œλ‘œ λ‹€λ₯Έ μ„œλ²„μ— λΆ„μ‚° μ €μž₯. - **Sharding Key:** 데이터λ₯Ό λ‚˜λˆ„λŠ” κΈ°μ€€κ°’. 데이터가 νŠΉμ • μ„œλ²„μ— 쏠리지 μ•Šλ„λ‘ κ³ λ₯΄κ²Œ λΆ„μ‚°μ‹œν‚€λŠ” 것이 핡심. - **의의:** μ„œλΉ„μŠ€κ°€ 폭발적으둜 μ„±μž₯해도 인프라λ₯Ό μ¦μ„€ν•˜μ—¬ λŒ€μ‘ν•  수 μžˆλŠ” 'μˆ˜ν‰μ  ν™•μž₯μ„±(Horizontal Scalability)'의 기술적 κ·Όκ°„. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** 샀딩은 데이터 μ •ν•©μ„± μœ μ§€μ™€ 쑰인(Join) 연산이 κ·Ήλ„λ‘œ μ–΄λ ΅λ‹€λŠ” 단점이 μžˆμ—ˆμœΌλ‚˜, μ΅œκ·Όμ—λŠ” 'λΆ„μ‚° SQL DB(CockroachDB, Spanner λ“±)'의 λ“±μž₯으둜 μ• ν”Œλ¦¬μΌ€μ΄μ…˜ μˆ˜μ€€μ˜ λ³΅μž‘λ„ 없이 μžλ™ν™”λœ 샀딩과 정합성을 λ™μ‹œμ— 보μž₯ν•˜λŠ” λ°©ν–₯으둜 λ°œμ „ν•¨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” μ—μ΄μ „νŠΈμ˜ λŒ€κ·œλͺ¨ 지식 λ…Έλ“œμ™€ 벑터 μž„λ² λ”© 데이터λ₯Ό μ €μž₯ν•  λ•Œ, 검색 λΉˆλ„μ™€ λ¬Έμ„œ μΉ΄ν…Œκ³ λ¦¬λ₯Ό κ³ λ €ν•œ 동적 샀딩 μ „λž΅μ„ 톡해 κΈ€λ‘œλ²Œ 검색 μ§€μ—° μ‹œκ°„μ„ μ΅œμ†Œν™”ν•¨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Scalability-in-AI-Systems|Scalability-in-AI-Systems]], [[Schema-Design-for-NoSQL|Schema-Design-for-NoSQL]], [[Relational-Databases|Relational-Databases]], [[High-Availability-Systems|High-Availability-Systems]] - **Raw Source:** 10_Wiki/Topics/AI/Sharding-and-Partitioning.md