# 순환 신경망 및 LSTM (RNN & LSTM) ## 📌 Brief Summary 순환 신경망(Recurrent Neural Networks, RNN)은 데이터의 순서와 맥락을 파악하기 위해 이전 단계의 정보를 은닉 상태(Hidden State)에 저장하고 다음 단계로 전달하는 신경망 아키텍처입니다 [1, 2]. LSTM(Long Short-Term Memory)은 RNN의 치명적인 약점인 정보 손실 문제를 '게이트(Gate)' 구조로 해결하여 장기 의존성(Long-term Dependency) 학습을 가능하게 한 진화된 모델입니다 [1, 3]. ## 📖 Core Content * **RNN (순환 신경망)의 원리 및 한계** - **순환 구조**: 현재의 입력값과 이전 단계의 은닉 상태를 결합하여 처리함으로써 시퀀스(Sequence) 데이터를 인지합니다 [1]. - **장기 의존성 문제**: 시퀀스가 길어질수록 앞부분의 정보가 뒤로 전달되지 못하고 사라지는 '기울기 소실(Vanishing Gradient)' 문제가 발생합니다 [1, 4]. * **LSTM (장단기 메모리)의 혁신** - **게이트 메커니즘**: 정보를 잊을지(Forget Gate), 저장할지(Input Gate), 내보낼지(Output Gate)를 스스로 결정하는 3개의 게이트를 통해 중요한 정보를 선별적으로 기억합니다 [1, 5, 6]. - **장기 기억 유지**: 이를 통해 텍스트 번역, 음성 인식, 시계열 예측 등 긴 맥락이 필요한 작업에서 탁월한 성능을 발휘합니다 [1, 7]. * **GRU (Gated Recurrent Unit)** - LSTM의 복잡한 구조를 간소화하여 연산 효율성을 높인 모델로, 데이터가 적거나 빠른 처리가 필요할 때 효과적입니다 [1]. ## ⚖️ Trade-offs & Caveats - **병렬 처리의 한계**: RNN 계열은 데이터를 순차적으로 처리해야 하므로 대규모 데이터 학습 시 병렬 처리가 어렵습니다. 이는 현재 모든 데이터를 한꺼번에 병렬로 처리하는 트랜스포머(Transformer) 아키텍처로 주류가 넘어간 주된 이유입니다 [1, 8]. - **실시간 효율성**: 그러나 초경량 실시간 시계열 예측이나 저지연 센서 데이터 처리에서는 여전히 RNN 계열이 트랜스포머보다 효율적일 수 있습니다 [1]. ## 🔗 Knowledge Connections ### Related Concepts (Auto-Linked) * [[2026-04-30]] * [[Analysis]] * [[LSTM]] * [[State]] * [[memory]] - **Related Topics**: 심층 학습 (Deep Learning, 자연어 처리 (NLP), 시계열 분석 (Time-Series Analysis), 트랜스포머 (Transformer - **Projects/Contexts**: 실시간 로그 분석 시스템, 음성 인터페이스 엔진 --- *Last updated: 2026-04-30*