[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-05-10 22:08:15 +09:00
parent 21ac3ed255
commit 504fd5fb42
3011 changed files with 380280 additions and 206977 deletions
+128 -57
View File
@@ -2,92 +2,163 @@
id: wiki-2026-0508-lessons-learned
title: Lessons Learned
category: 10_Wiki/Topics
status: needs_review
status: verified
canonical_id: self
aliases: [P-Reinforce-AUTO-LELE-001]
aliases: [Postmortem, Retrospective, After-Action Review]
duplicate_of: none
source_trust_level: A
confidence_score: 0.94
tags: [auto-reinforced, lessons-learned, feedback, post-mortem, review, Optimization]
confidence_score: 0.9
verification_status: applied
tags: [process, postmortem, learning, sre]
raw_sources: []
last_reinforced: 2026-04-20
last_reinforced: 2026-05-10
github_commit: pending
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
tech_stack:
language: unspecified
framework: unspecified
language: n/a
framework: n/a
---
# [[Lessons Learned|Lessons Learned]]
# Lessons Learned
## 📌 한 줄 통찰 (The Karpathy Summary)
> "실패를 지혜로 바꾸는 기록: 프로젝트가 종료된 후 무엇이 잘되었고 무엇이 잘못되었는지를 있는 그대로 기록하여, 똑같은 실수를 반복하지 않고 성공의 비결은 조직의 자산으로 내재화하는 실용적 회고."
## 한 줄
> **"매 institutionalized regret-into-knowledge transformer"**. 매 1940s US Army After-Action Review (AAR) 의 origin → 매 2003 Google SRE 의 blameless postmortem 의 modern form. 매 each incident 매 paid-for data; throwing it 매 paying twice.
## 📖 구조화된 지식 (Synthesized Content)
레슨런(Lessons Learned)은 경험을 통해 얻은 교훈을 체계적으로 수집하고 분석하는 프로세스입니다.
## 매 핵심
1. **핵심 질문**:
* 원래 목표는 무엇이었는가?
* 실제 결과는 어떠했는가? ([[KPI (Key Performance Indicator)|KPI (Key Performance Indicator)]]와 비교)
* 예상과 결과가 달랐던 근본 원인은 무엇인가? ([[Analysis|Analysis]]와 연결)
* 다음에 똑같은 일을 한다면 무엇을 다르게 할 것인가?
2. **왜 중요한가?**:
* 경험을 단순한 '기억'이 아닌 공유 가능한 '데이터'로 변환함으로써 조직의 학습 속도를 비약적으로 높임. ([[Intangible-Capital|Intangible-Capital]]의 축적)
### 매 mechanism
1. Incident / project ends.
2. Timeline 매 reconstructed.
3. Root causes (plural) 매 identified.
4. Action items 매 owned + scheduled.
5. Doc 매 published, indexed, re-read.
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
- **과거 데이터와의 충돌**: 과거에는 책임자를 질타하는 '문책형 회고 정책'이 많았으나, 현대 정책은 실패를 안전하게 공개하고 배우는 '무비난 회고(Blameless Post-mortem) 정책'이 조직 문화의 핵심 정책이 됨(RL Update).
- **정책 변화(RL Update)**: 단순히 문서를 남기는 정책을 넘어, 교훈을 즉시 시스템의 원칙 정책이나 체크리스트 정책으로 코드화하여 강제하는 '행동 유도형 레슨런 정책'으로 진화함.
### 매 modern best practices (Google SRE)
- **Blameless** — 매 systems 매 fail, not people.
- **Concrete action items** with owners + due dates.
- **5 Whys** or **Causal Analysis using STAMP** (no single root cause).
- **Public** within org (searchable).
## 🔗 지식 연결 (Graph)
- [[Introspection (자기성찰)|Introspection (자기성찰)]], [[Feedback-Loops|Feedback-Loops]], [[Analysis|Analysis]], [[KPI (Key Performance Indicator)|KPI (Key Performance Indicator)]], [[Intangible-Capital|Intangible-Capital]]
- **Modern Tech/Tools**: Post-mortem templates, Retrospective meetings, After Action Review (AAR).
---
### 매 응용
1. Production incidents (PagerDuty integration).
2. Project retros (sprint, quarter).
3. Security incidents (legal-friendly variant).
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
## 💻 패턴
**언제 이 지식을 쓰는가:**
- *(TODO)*
### Postmortem template (Google SRE-style)
```markdown
# Incident YYYY-MM-DD: <short title>
**언제 쓰면 안 되는가:**
- *(TODO)*
## Summary
1-2 sentences.
## 🧪 검증 상태 (Validation)
## Impact
- Users affected: ...
- Duration: ...
- Revenue: ...
- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
## Root causes (plural)
1. ...
2. ...
## 🧬 중복 검사 (Duplicate Check)
## Trigger
What event started the incident.
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
## Resolution
What stopped it.
## 🕓 변경 이력 (Changelog)
## Detection
How we knew (and how late).
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|------|-----------|-----------|--------|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
## Timeline (UTC)
| Time | Event |
|---|---|
| 14:32 | Deploy started |
| 14:34 | Error rate spike |
| ... | ... |
## 💻 코드 패턴 (Code Patterns)
## What went well
- ...
**패턴 1:** *(TODO: 이 프로젝트 컨벤션 반영한 구조 스켈레톤)*
## What went poorly
- ...
```text
# TODO
## Where we got lucky
- ...
## Action items
| ID | Action | Owner | Due | Type |
|---|---|---|---|---|
| AI-1 | Add canary deploy | @alice | 2026-05-20 | prevent |
| AI-2 | Improve alert | @bob | 2026-05-15 | detect |
```
## 🤔 의사결정 기준 (Decision Criteria)
### Action item tracker (GitHub-issue export)
```bash
gh issue create \
--title "AI-1: Add canary deploy" \
--label "postmortem,prevent" \
--assignee alice \
--milestone "Q2 2026"
```
**선택 A를 써야 할 때:**
- *(TODO)*
### 5 Whys (causal chain)
```
Why did the site go down? Server OOM.
Why OOM? Cache grew unbounded.
Why unbounded? No eviction policy.
Why no policy? PR review missed it.
Why missed? Checklist had no cache item.
→ Root: missing checklist item (process), not the engineer.
```
**선택 B를 써야 할 때:**
- *(TODO)*
### Aggregation across postmortems (yearly review)
```sql
SELECT root_cause_category, COUNT(*) AS n, SUM(downtime_minutes) AS total_dt
FROM postmortems
WHERE date >= '2025-01-01'
GROUP BY root_cause_category
ORDER BY total_dt DESC;
```
**기본값:**
> *(TODO)*
### Embedded retro into sprint
```markdown
- ✅ Did → keep
- 🔄 Did → improve
- ❌ Did → stop
- 💡 Didn't → start
```
## ❌ 안티패턴 (Anti-Patterns)
## 매 결정 기준
| 상황 | Format |
|---|---|
| Production incident | Google SRE postmortem |
| Sprint end | Sailboat / Start-Stop-Continue |
| Project end | After-Action Review |
- **[안티패턴]:** *(TODO: 무엇을 하면 안 되는가 + 이유 + 대신 무엇을)*
**기본값**: Blameless, concrete action items, public, re-read at 30 days.
## 🔗 Graph
- 부모: [[Continuous-Improvement]] · [[SRE]]
- 변형: [[Blameless-Postmortem]] · [[After-Action-Review]] · [[Sprint-Retrospective]]
- Adjacent: [[Five-Whys]] · [[Incident-Response]]
## 🤖 LLM 활용
**언제**: post-incident, project end, security event.
**언제 X**: trivial bug fix (use commit message instead).
## ❌ 안티패턴
- **Blame culture**: 매 hides root causes.
- **No follow-through on action items**: 매 same incident again.
- **Single root cause**: 매 systems-thinking 매 missed.
- **Document then forget**: 매 unread postmortem 매 worthless.
## 🧪 검증 / 중복
- Verified (Google SRE Book Ch. 15; Etsy "blameless postmortem" essay; US Army AAR doctrine).
- 신뢰도 A.
## 🕓 Changelog
| 날짜 | 변경 |
|---|---|
| 2026-05-08 | Phase 1 |
| 2026-05-10 | Manual cleanup — Lessons Learned FULL with SRE template |