Files
2nd/10_Wiki/Topics_GD/LSTM.md
T

2.5 KiB


id: DL-LSTM-ARCH-001 category: "10_Wiki/💡 Topics/AI" confidence_score: 1.0 tags: [ai, Deep-Learning, lstm, neural-network-Architecture, gating-mechanism, mathematical-model] last_reinforced: 2026-04-26

LSTM Architecture (LSTM 구조와 게이트 원리)

📌 한 줄 통찰 (The Karpathy Summary)

"정보의 흐름 위에 세 개의 검문소(Gates)를 세워, 무엇을 버리고 무엇을 남길지 수치적으로 결정하라" — 셀 상태(Cell State)라는 고속도로를 통해 정보를 온전히 보존하면서, 비선형 게이트들을 통해 실시간으로 지식의 가중치를 조절하는 정교한 순환 신경망 구조.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: "Gated Information Flow" — 덧셈 기반의 정보 갱신(Cell State)을 통해 기울기 소실을 막고, 곱셈 기반의 제어 장치(Gates)를 통해 정보의 유입과 유출을 조절하는 동적 정보 제어 패턴.
  • 핵심 게이트 메커니즘:
    • Forget Gate: 과거의 정보 중 버릴 것을 결정 (0 \sim 1 사이의 값).
    • Input Gate: 현재 유입된 정보 중 셀 상태에 반영할 지식의 비중 결정.
    • Output Gate: 갱신된 셀 상태를 바탕으로 다음 단계로 전달할 최종 출력값 산출.
  • Cell State: 정보를 가공 없이 다음 단계로 전달하는 '장기 기억' 저장소. 기울기가 폭주하거나 소실되지 않고 흐를 수 있는 통로 제공.
  • 의의: 기존 RNN의 구조적 한계를 수학적으로 극복하여, 복잡한 비선형적 시퀀스 의존성을 학습 가능케 함.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 복잡한 게이트 구조가 연산 비용을 높인다는 지적에 따라, 게이트 수를 줄인 GRU(Gated Recurrent Unit)가 등장했으나, 데이터가 충분히 많고 세밀한 제어가 필요한 환경에서는 여전히 원조 LSTM의 구조가 강력한 성능을 발휘함.
  • 정책 변화: Antigravity 프로젝트는 에이전트의 내부 '사고 버퍼(Thought Buffer)'를 설계할 때, 중요한 논리 단계를 잊지 않고 보존하기 위해 LSTM의 셀 상태 아키텍처 원리를 응용함.

🔗 지식 연결 (Graph)