Files
2nd/01_Archive/2026-04-20/넷플릭스(Netflix)의 마이크로서비스 및 코스모스 플랫폼 전환.md

47 lines
5.7 KiB
Markdown

---
id: P-REINFORCE-AUTO-AC1C1C
category: "10_Wiki/💡 Topics/Programming & Language"
confidence_score: 0.90
tags: [auto-reinforced]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - 넷플릭스(Netflix)의 마이크로서비스 및 코스모스 플랫폼 전환"
---
# [[넷플릭스(Netflix)의 마이크로서비스 및 코스모스 플랫폼 전환|넷플릭스(Netflix)의 마이크로서비스 및 코스모스 플랫폼 전환]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> 넷플릭스(Netflix)는 비즈니스 혁신과 안정성을 위해 기존의 RDBMS 기반 모놀리식 아키텍처를 독립적인 마이크로서비스로 전환하여 뛰어난 확장성과 가용성을 확보했습니다 [1, 2]. 이후 비디오 및 오디오 처리와 같은 미디어 중심의 비동기식 대규모 워크플로우에서 발생하는 병목 현상을 해결하기 위해 마이크로서비스, 워크플로우, 서버리스 함수를 결합한 '코스모스(Cosmos)' 플랫폼을 새롭게 도입했습니다 [3, 4]. 코스모스 플랫폼은 다차원적인 관심사 분리를 통해 인프라와 애플리케이션 코드를 격리하고 시스템의 모듈성 및 생산성을 비약적으로 향상시켰습니다 [4, 5].
## 📖 구조화된 지식 (Synthesized Content)
**마이크로서비스 아키텍처로의 전환 및 운영**
* 넷플릭스는 2008년부터 확장성의 한계를 극복하기 위해 기존 모놀리식 아키텍처에서 마이크로서비스 기반으로 인프라를 이전하기 시작했습니다 [1, 2].
* 이 전환은 서비스의 무상태성(Stateless) 유지와 수평적 확장을 원칙으로 하였으며, 카오스 몽키(Chaos Monkey)를 포함한 Simian Army를 통해 파괴적 테스트를 자동화하여 장애 복원력을 높였습니다 [2, 6].
* 데이터베이스 계층 또한 다중 리전 복제와 파티션 허용 오차가 뛰어난 NoSQL인 카산드라(Cassandra)로 교체했습니다 [6].
* 이러한 마이크로서비스로의 전환은 넷플릭스 내 개별 팀의 개발 및 배포 독립성을 보장하여 혁신 속도를 높였으며, 연간 52분의 다운타임만 허용하는 99.999%의 가용성을 달성하는 데 기여했습니다 [7, 8].
**코스모스(Cosmos) 플랫폼의 도입 배경**
* 넷플릭스의 미디어 클라우드 엔지니어링 및 인코딩 기술 팀은 미디어 파일의 처리를 위해 3세대 시스템인 'Reloaded(리로디드)'를 수년간 성공적으로 운영해 왔습니다 [9].
* 그러나 시스템 규모가 커지고 개발 인력과 유스케이스가 확장되면서, 기존 모놀리식 구조에서는 인프라 코드와 애플리케이션 코드가 뒤섞여 신규 기능의 배포가 지연되는 심각한 병목 현상이 발생했습니다 [4, 9, 10].
* 이를 해결하기 위해 비동기 워크플로우와 서버리스 기능을 결합한 미디어 중심의 마이크로서비스 플랫폼 '코스모스(Cosmos)'가 구축되었으며, 기존 Reloaded 시스템을 대체하기 위해 스트랭글러 피그(Strangler fig) 패턴을 채택하여 점진적인 전환을 시도했습니다 [4, 5, 11].
**코스모스 플랫폼의 다차원적 관심사 분리(Separation of Concerns)**
코스모스는 플랫폼과 애플리케이션 사이의 분리뿐만 아니라, 논리적 계층을 3개로 분리함으로써 고도의 관심사 분리를 구현했습니다 [4, 12].
* **Optimus(옵티머스)**: 외부의 요청을 내부 비즈니스 모델로 매핑해 주는 API 계층입니다 [4, 13].
* **Plato(플라톤)**: 비즈니스 규칙을 모델링하고 무상태 함수들을 오케스트레이션하는 워크플로우 계층입니다 [4, 13, 14].
* **Stratum(스트라툼)**: 무상태이면서 고도의 계산 집약적인 함수들을 실행하는 서버리스 계층입니다 [4, 13].
* **Timestone(타임스톤)**: 위의 각 하위 시스템들이 비동기적으로 통신할 수 있도록 지원하는 대규모 우선순위 큐잉 시스템으로, 각 컴포넌트 간의 결합도를 극도로 낮추는 핵심적인 역할을 합니다 [4, 13].
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** Programming & Language 분야의 자동 자산화 수행.
## 🔗 지식 연결 (Graph)
- **Related Topics:** [[마이크로서비스 아키텍처 (Microservices Architecture)|Microservices Architecture]], [[_뇌와 팔다리의 분리_ - 관심사의 분리 (Separation of Concerns)|Separation of Concerns]], Serverless Functions, Asynchronous Workflows, [[카오스 몽키(Chaos Monkey)|Chaos Monkey]]
- **Projects/Contexts:** [[리로디드(Reloaded)|Reloaded]], [[타파스(Tapas)|Tapas]], Sagan, [[스트랭글러 피그 패턴(Strangler Fig Pattern)|Strangler Fig Pattern]]
- **Contradictions/Notes:** 마이크로서비스 전환과 코스모스와 같은 분산 플랫폼의 구축은 혁신과 확장성 측면에서 큰 이점을 제공하지만, 그 대가로 분산 시스템의 통신 메커니즘을 직접 구현해야 하는 설계적 복잡성을 증가시킵니다 [15, 16]. 또한 여러 서비스 인스턴스를 독립적으로 실행하고 배포해야 하므로, 메모리 소비가 증가하고 운영 비용이 상승하는 단점이 존재합니다 [16-18].
---
*Last updated: 2026-04-18*
- Raw Source: 00_Raw/2026-04-20/넷플릭스(Netflix)의 마이크로서비스 및 코스모스 플랫폼 전환.md
---