docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, fault-tolerance, reliability, distributed-systems, redun
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Fault-Tolerance]]
|
||||
# [[Fault-Tolerance|Fault-Tolerance]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "중단 없는 강인함: 시스템의 일부 구성 요소에 고장이 나더라도, 서비스 전체가 멈추지 않고(Graceful Degradation) 자동으로 복구되거나 예비 자원을 가동하여 임무를 완수하게 만드는 신뢰성 설계의 핵심."
|
||||
@@ -26,6 +26,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: AI 모델 추론 정책에서도 특정 노드나 연산 장치에 오류가 발생했을 때 이를 우회하여 정답을 도출하는 '강건한 신경망 추론 정책' 연구가 활발함. (Chaos Engineering과 연결)
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Distributed-Systems]], [[Scalability]], [[Technical-Architecture]], [[Quality Gates]], Monitoring
|
||||
- [[Distributed-Systems|Distributed-Systems]], [[Scalability|Scalability]], [[Technical-Architecture|Technical-Architecture]], [[Quality Gates|Quality Gates]], Monitoring
|
||||
- **Modern Tech/Tools**: Raid, Kubernetes (Self-healing), Netflix Chaos Monkey, Kafka replication.
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user