---
id: DL-SSM-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [ai, deep-learning, ssm, state-space-models, mamba, sequence-modeling, efficiency, transformer-alternative]
last_reinforced: 2026-04-26
---

# State Space Models (SSM, 상태 공간 모델)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 흐름을 연속적인 '상태의 변화'로 모델링하여 트랜스포머의 연산 병목을 돌파하고, 무한에 가까운 문맥을 선형적인 효율성($O(N)$)으로 포착하라" — 고전 제어 이론의 상태 방정식을 현대적 신경망으로 재해석하여 초장기 시퀀스 처리에 최적화된 차세대 아키텍처.

## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Continuous State Evolution and Recurrent-Convolutional Duality" — 입력을 은닉 상태(Hidden State)로 압축하여 업데이트해 나가는 순환 방식(Recurrent)과, 이를 한꺼번에 처리하는 합성곱 방식(Convolutional)의 장점을 결합하여 연산 효율과 병렬성을 동시에 달성하는 패턴.
- **핵심 특징:**
    - **Linear Scalability:** 시퀀스 길이에 비례해 연산량이 늘어남 ($O(N)$). 트랜스포머($O(N^2)$) 대비 압도적 효율.
    - **Memory Efficiency:** 전체 과거 데이터를 다 기억하지 않고도 핵심 상태값만을 유지하며 무한한 길이 대응 가능.
    - **Selective Mechanism (Mamba):** 중요한 정보는 남기고 사소한 정보는 잊는 지능형 필터링 기능 탑재.
- **의의:** 텍스트뿐만 아니라 수십만 프레임의 영상, 긴 DNA 염기서열 등 기존 트랜스포머가 처리하기 힘들었던 '거대 시퀀스' 분석의 새로운 지평을 염.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 시퀀스 모델링은 어텐션(Attention)이 유일한 정답이라는 믿음을 깨고, 고전적인 상태 공간 개념이 현대적 하드웨어 최적화(Flash Attention과 유사한 기법)와 만나 트랜스포머를 위협하는 강력한 대안으로 부상함.
- **정책 변화:** Antigravity 프로젝트는 실시간으로 쏟아지는 방대한 에이전트 로그 분석이나 실시간 스트리밍 지식 처리 시, 저지연과 고효율이 보장된 SSM 기반의 경량 모델을 실험적으로 적용함.

## 🔗 지식 연결 (Graph)
- [[Self-Attention-Mechanisms|Self-Attention-Mechanisms]], Recurrent-Neural-Networks-RNN, [[Scalability-in-AI-Systems|Scalability-in-AI-Systems]], [[Sequence-to-Sequence-Models|Sequence-to-Sequence-Models]]
- **Raw Source:** 10_Wiki/Topics/AI/State-Space-Models.md