feat: Wiki 지식 자산 업데이트 - UX Scenarios, Frontend, Game Design, Topics 추가 [2026-05-08]

This commit is contained in:
2026-05-08 19:52:07 +09:00
parent 9dd3d40662
commit 5ba5a55c78
3984 changed files with 334557 additions and 28839 deletions
@@ -1,9 +1,26 @@
---
id: wiki-2026-0508-selective-state-space-models-mam
title: Selective State Space Models (Mamba)
category: 10_Wiki/Topics
status: needs_review
canonical_id: self
aliases: []
duplicate_of: none
source_trust_level: A
confidence_score: 0.92
tags: [uncategorized]
raw_sources: []
last_reinforced: 2026-05-08
github_commit: pending
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
---
# [[선택적 상태 공간 모델 (Mamba)]]
## 📌 Brief Summary
## 📌 한 줄 통찰 (The Karpathy Summary)
선택적 상태 공간 모델(Mamba)은 긴 시퀀스를 처리할 때 선형적인 연산 시간($O(N)$)을 보장하면서도 강력한 맥락 통합 능력을 보여주는 신경망 아키텍처이다 [1, 2]. 과거의 입력 기록 중 현재 입력과 관련된 정보만 선택적으로 집중하거나 무시할 수 있는 '선택적 상태 공간 모델(S6)' 메커니즘을 핵심으로 한다 [1, 3]. 훈련 시 메모리 사용량이 선형적으로 증가하고 추론 시에는 고정된 크기의 상태(constant memory)를 유지하여 효율성을 극대화함으로써 트랜스포머(Transformer)의 강력한 대안으로 부상하고 있다 [4, 5].
## 📖 Core Content
## 📖 구조화된 지식 (Synthesized Content)
* **맥락의 선택적 수용 및 통합 (Selective State Space Model)**
일반적인 상태 공간 모델(SSM)은 시퀀스의 모든 정보를 동일한 동역학(fixed dynamics)으로 처리하지만, Mamba의 '선택적 SSM'은 현재 입력 데이터에 따라 정보를 기억할지 버릴지를 동적으로 결정한다 [2, 6]. 이는 마치 사람이 중요한 내용은 노트에 요약하고 불필요한 부분은 잊어버리는 것과 유사하게 작동하여 정보 병목을 막고 맥락 통합의 효율성을 극대화한다 [2].
@@ -16,11 +33,10 @@
* **Mamba-3와 진화된 아키텍처**
Mamba-3는 추론 효율성(inference efficiency)에 일차적인 초점을 맞추어 설계되었다 [11]. 지수-사다리꼴 이산화(exponential-trapezoidal discretization) 체계에서 파생된 더 표현력 있는 순환(recurrence) 구조와 복소수 값 상태 추적(complex-valued state tracking), 그리고 디코딩 지연 시간을 늦추지 않으면서 정확도를 높이는 다중 입력-출력(MIMO) 변형을 도입하여 성능의 지평을 넓혔다 [11, 12].
## Trade-offs & Caveats
## 모순 및 업데이트 (Contradictions & Updates)
Mamba는 추론 시 시퀀스의 길이에 상관없이 고정된 크기의 상태(fixed-size state) 표현을 유지하므로 메모리 사용이 일정하고 속도가 빠르다는 엄청난 장점이 있다 [5, 13]. 하지만 바로 이 고정된 상태 크기라는 특성 때문에 모든 과거 정보를 하나의 표현으로 압축해야 하므로, 트랜스포머 모델의 KV 캐시처럼 지속적으로 커지는 정확한 과거 정보를 모두 저장할 수 없다는 근본적인 한계(반대 급부)를 지닌다 [13]. 그 결과, 인-컨텍스트 학습(in-context learning)이나 퓨샷 프롬프팅(few-shot prompting), 긴 맥락에서의 정밀한 복사 및 추론과 같은 일부 작업에서는 트랜스포머에 비해 정밀도가 떨어지는 제약 사항이 있다 [5]. 이를 극복하기 위해 선형 층의 효율성과 셀프 어텐션의 데이터베이스 같은 정밀한 저장 능력을 결합한 하이브리드 아키텍처가 제안되고 있다 [2, 14].
## 🔗 Knowledge Connections
## 🔗 지식 연결 (Graph)
### Related Concepts
#### [아키텍처/기반 기술]
@@ -58,4 +74,30 @@ Mamba는 추론 시 시퀀스의 길이에 상관없이 고정된 크기의 상
- 확장 방향: GPU의 SRAM 및 전역 메모리(Global Memory) 계층을 활용하는 병렬 프리픽스 스캔(Parallel Scan)과 플래시 어텐션(FlashAttention) 기술 등 딥러닝 연산을 하드웨어 단에서 최적화하는 기법 탐구.
---
*Last updated: 2026-05-04*
*Last updated: 2026-05-04*
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
**언제 이 지식을 쓰는가:**
- *(TODO)*
**언제 쓰면 안 되는가:**
- *(TODO)*
## 🧪 검증 상태 (Validation)
- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
## 🧬 중복 검사 (Duplicate Check)
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
## 🕓 변경 이력 (Changelog)
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|------|-----------|-----------|--------|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |