[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -2,7 +2,7 @@
|
||||
id: RNN-GRU-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, deep-learning, rnn, gru, lstm, sequence-modeling]
|
||||
tags: [ai, [[Deep-Learning]], rnn, gru, [[LSTM]], [[Sequence-Modeling]]]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
@@ -16,13 +16,13 @@ last_reinforced: 2026-04-26
|
||||
- **핵심 구조:**
|
||||
- **Reset Gate:** 과거의 상태를 얼마나 무시할지 결정 (과거 정보의 선택적 망각).
|
||||
- **Update Gate:** 과거의 정보와 현재의 정보를 어떤 비율로 섞어 새로운 상태를 만들지 결정 (LSTM의 Forget/Input 게이트 통합).
|
||||
- **No Cell State:** LSTM과 달리 별도의 셀 상태 없이 은닉 상태(Hidden State)만으로 정보 전달.
|
||||
- **No Cell [[State]]:** LSTM과 달리 별도의 셀 상태 없이 은닉 상태(Hidden State)만으로 정보 전달.
|
||||
- **의의:** 데이터셋이 상대적으로 작거나 연산 자원이 제한적인 환경에서 LSTM의 훌륭한 대안이 되며, 언어 모델링 및 시계열 예측에서 널리 활용됨.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 복잡할수록 성능이 좋을 것이라는 편견을 깨고, 구조를 단순화(Less parameters)함으로써 오히려 학습 속도와 일반화 성능을 높일 수 있음을 증명.
|
||||
- **과거 데이터와의 충돌:** 복잡할수록 성능이 좋을 것이라는 편견을 깨고, 구조를 단순화(Less [[Parameter]]s)함으로써 오히려 학습 속도와 일반화 성능을 높일 수 있음을 증명.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 단기 대화 이력을 요약하거나 시퀀스 기반의 이상 징후를 감지할 때, 연산 효율성이 높은 GRU 아키텍처를 우선적으로 고려함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- LSTM-Long-Short-Term-Memory, RNN-Foundations, [[Sequence-to-Sequence-Models]], Deep-Learning-Foundations
|
||||
- LSTM-[[Long-Short-Term-Memory]], RNN-Foundations, [[Sequence-to-Sequence-Models]], Deep-Learning-Foundations
|
||||
- **Raw Source:** 10_Wiki/Topics/AI/GRU.md
|
||||
|
||||
Reference in New Issue
Block a user