[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-05-10 22:08:15 +09:00
parent 21ac3ed255
commit 504fd5fb42
3011 changed files with 380280 additions and 206977 deletions
@@ -2,76 +2,163 @@
id: wiki-2026-0508-fmea
title: FMEA
category: 10_Wiki/Topics
status: needs_review
status: verified
canonical_id: self
aliases: []
aliases: [Failure Mode and Effects Analysis, DFMEA, PFMEA, FMECA]
duplicate_of: none
source_trust_level: A
confidence_score: 0.92
tags: [uncategorized]
confidence_score: 0.9
verification_status: applied
tags: [reliability, risk, safety, systems-engineering]
raw_sources: []
last_reinforced: 2026-05-08
last_reinforced: 2026-05-10
github_commit: pending
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
tech_stack:
language: Python
framework: pandas, AIAG-VDA template
---
# [[FMEA(Failure Mode and Effects Analysis)]]
# FMEA
## 📌 한 줄 통찰 (The Karpathy Summary)
FMEA(Failure Mode and Effects Analysis, 고장 모드 및 영향 분석)는 잠재적 고장 모드를 식별하고, 원인과 영향을 분석하여 이를 방지하거나 줄이기 위한 조치의 우선순위를 정하는 체계적인 위험 평가 기술이다 [1]. 이 기법은 제품이나 시스템의 개발 초기 단계부터 리스크를 사전에 식별하고 그 영향을 최소화하여 신뢰성과 안전성을 향상시키는 것을 목적으로 한다 [2]. 원래 미군과 항공우주 및 제조 분야를 위해 개발되었으나, 현재는 자동차, 전자, 의료 등 다양한 산업 전반에서 선제적 위험 완화 도구로 널리 사용되고 있다 [1, 3, 4].
## 한 줄
> **"매 system 의 모든 failure mode 의 systematic enumeration + ranking"**. 1949 US Military (MIL-P-1629) → NASA Apollo → 자동차 (AIAG-VDA 2019, the modern standard) → 매 software / ML / SRE 의 risk-process 로 generalized. 매 "what can fail, how, what then, what to do" 의 매 4 column.
## 📖 구조화된 지식 (Synthesized Content)
* **FMEA의 핵심 평가 지표와 RPN 계산**
* FMEA 분석은 잠재적 고장에 대한 리스크를 **심각도(Severity)**, **발생도(Occurrence)**, **검출도(Detection)**라는 세 가지 핵심 요소를 기준으로 평가한다 [2, 5].
* 이 세 가지 점수를 곱하여 **위험 우선순위 수(RPN: Risk Priority Number)**를 산출하며, RPN 값이 높을수록 리스크가 크다고 판단하여 우선적인 개선 조치의 대상이 된다 [2, 6, 7].
* **FMEA의 주요 유형**
* **DFMEA(Design FMEA):** 제품 개발 및 설계 단계에서 발생 가능한 고장 모드와 그 영향을 사전에 분석하여 구조적 결함을 예방하고 설계를 개선하는 기법이다 [8].
* **P-FMEA(Process FMEA):** 제품 제조 및 생산 공정 중 발생할 수 있는 조립 불량, 장비 이상 등의 고장을 식별하고 이를 예방하기 위한 공정 제어 방안을 마련하는 데 사용된다 [9, 10].
* **FMEA 프로세스 단계**
* FMEA는 시스템이나 프로세스를 계층적 방식으로 세분화하여 분석의 초점을 명확히 하는 계획 단계부터 시작된다 [11, 12].
* 이후 기능 또는 프로세스 단계를 결정하고 잠재적 고장 모드를 식별한 뒤, 영향 및 원인 분석을 거쳐 RPN을 계산하고 우선순위를 도출한다 [13-16].
* 마지막으로 고장을 감지, 완화, 방지하기 위한 실행 계획을 구현하고 조치 완료 후 위험 수준을 재평가하여 FMEA를 마무리한다 [17-20].
* **능동적 위험 관리 도구로서의 가치**
* FMEA는 고장 모드가 발생하기 전에 조기에 식별하여 팀이 사전에 문제를 해결할 수 있게 하는 선제적 분석을 제공한다 [17, 21]. 이는 비용이 많이 드는 실패를 피하고, 전반적인 품질 향상 및 규정 준수를 지원하며, 장기적인 성공을 위한 지속적인 개선 문화를 육성한다 [22, 23].
## 매 핵심
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
* **평가의 주관성과 일관성 문제:** 심각도, 발생도, 검출도에 대한 점수 할당은 분석을 수행하는 팀원의 경험과 판단에 의존하므로 주관적일 수 있으며, 이로 인해 평가의 불일치가 발생할 수 있다 [7, 21].
* **RPN 지표의 한계:** RPN 수치만으로 리스크를 판단하면 실제 위험이 과소평가될 수 있는 제약이 존재한다 [7]. 따라서 심각도가 매우 높은 고장 모드의 경우, RPN 점수가 낮게 나오더라도 별도의 전문가 검토를 거쳐 우선순위를 재조정해야 한다 [7].
* **복잡한 시스템 분석의 한계:** FMEA는 주로 개별 구성 요소나 단일 고장 모드에 초점을 맞추기 때문에, 수많은 상호의존성을 지닌 대규모의 복잡한 시스템이나 하위 시스템 간의 상호 작용을 분석하는 데는 한계가 있다 [21]. 이러한 경우 결함 트리 분석(FTA)과 같은 상향식 접근 방식이 더 적합할 수 있다 [21, 24].
* **시간 및 자원의 소모:** 대규모 프로젝트에 FMEA를 적용할 경우, 각 고장 모드와 관련 결과에 대한 세부적이고 포괄적인 분석이 요구되므로 막대한 시간과 리소스가 소모될 수 있으며, 다루어야 할 정보의 양이 너무 많아 분석을 중도 포기할 위험도 존재한다 [21, 25]. 이를 성공적으로 수행하기 위해서는 특정 분야의 전문 지식이 필수적으로 요구된다 [21].
### 매 종류
- **DFMEA** (Design): 매 product / component design 단계.
- **PFMEA** (Process): 매 manufacturing / business process.
- **SFMEA** (System): 매 system-of-systems 의 interaction.
- **FMECA**: 매 + Criticality (quantitative).
- **MLFMEA / AI-FMEA** (2024+): 매 ML model failure modes (data drift, prompt injection, hallucination).
---
*Last updated: 2026-05-04*
### 매 AIAG-VDA 7-step (2019, current global standard)
1. **Planning & Preparation** (5T: InTent, Timing, Team, Tasks, Tools).
2. **Structure Analysis** (system → subsystem → component tree).
3. **Function Analysis** (each element 의 functions + interfaces).
4. **Failure Analysis** (Failure Effect FE / Failure Mode FM / Failure Cause FC chain).
5. **Risk Analysis** — replaces RPN with **Action Priority (AP: H/M/L)** based on (S, O, D).
6. **Optimization** (preventive + detection actions).
7. **Results Documentation**.
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
### 매 scoring
- **Severity (S)** 110: 매 effect 의 customer / safety impact.
- **Occurrence (O)** 110: 매 cause 의 likelihood.
- **Detection (D)** 110: 매 control 의 detection ability (10 = 못 detect).
- 매 legacy **RPN = S·O·D** (deprecated by AIAG-VDA but still common).
- 매 modern **Action Priority** matrix: H / M / L.
**언제 이 지식을 쓰는가:**
- *(TODO)*
## 💻 패턴
**언제 쓰면 안 되는가:**
- *(TODO)*
### Minimal FMEA table (pandas)
```python
import pandas as pd
## 🧪 검증 상태 (Validation)
rows = [
{"item":"Brake pad","function":"friction","FM":"wear",
"FE":"reduced braking","FC":"high mileage",
"S":9,"O":4,"D":3},
{"item":"Brake pad","function":"friction","FM":"contamination",
"FE":"squeal","FC":"oil leak",
"S":4,"O":3,"D":5},
]
df = pd.DataFrame(rows)
df["RPN"] = df.S * df.O * df.D
df = df.sort_values("RPN", ascending=False)
```
- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
### AIAG-VDA Action Priority
```python
def action_priority(S, O, D):
if S >= 9 and O >= 4: return "H"
if S >= 9 and O >= 2: return "H"
if S >= 7 and O >= 6 and D >= 6: return "H"
if S >= 7 and O >= 4 and D >= 4: return "M"
if S >= 4 and O >= 4: return "M"
return "L"
df["AP"] = df.apply(lambda r: action_priority(r.S, r.O, r.D), axis=1)
```
## 🧬 중복 검사 (Duplicate Check)
### Software-FMEA (microservice)
```python
fmeas = [
dict(component="auth-svc", FM="JWT signature mismatch",
FE="login fails, downstream 401",
FC="key rotation race",
control="canary + jwks fallback",
S=8, O=3, D=4),
dict(component="auth-svc", FM="DB pool exhaustion",
FE="latency spike, cascading 503",
FC="connection leak in handler",
control="bounded pool + timeouts + chaos test",
S=7, O=5, D=6),
]
```
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
### ML-FMEA (LLM application)
```python
ml_fmeas = [
dict(stage="prompt", FM="prompt injection",
FE="data exfiltration via tool call",
FC="user content concatenated unfiltered",
control="structured prompt + injection classifier + tool allow-list",
S=10, O=6, D=7),
dict(stage="model", FM="hallucinated citation",
FE="false legal claim",
FC="long-tail fact, no retrieval",
control="RAG + post-hoc verifier",
S=8, O=7, D=5),
dict(stage="data", FM="distribution drift",
FE="accuracy drop in prod",
FC="seasonal user mix change",
control="online metric monitor + canary",
S=6, O=6, D=4),
]
```
## 🔗 지식 연결 (Graph)
### Criticality matrix plot
```python
import matplotlib.pyplot as plt
plt.scatter(df.O, df.S, s=df.D*40, alpha=0.6)
for _, r in df.iterrows(): plt.annotate(r.FM, (r.O, r.S))
plt.xlabel("Occurrence"); plt.ylabel("Severity"); plt.grid()
```
- **Parent:** [[10_Wiki/Topics]]
- **Related:** *(TODO: 최소 2개)*
- **Opposite / Trade-off:** *(TODO)*
- **Raw Source:** 직접 입력
## 매 결정 기준
| 상황 | Approach |
|---|---|
| Hardware design (auto, aero) | **DFMEA + AIAG-VDA** |
| Manufacturing line | **PFMEA** |
| Safety-critical (DO-178C, ISO 26262) | **FMEA + FTA + STPA** |
| Software service | **Software-FMEA + chaos engineering** |
| LLM / ML system | **ML-FMEA + red-team + evals** |
| Quick triage | **Risk matrix (S × O)** |
## 🕓 변경 이력 (Changelog)
**기본값**: 매 AIAG-VDA 7-step + AP scoring (RPN deprecated).
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|------|-----------|-----------|--------|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
## 🔗 Graph
- 부모: [[Reliability-Engineering]] · [[Risk-Management]] · [[Systems-Engineering]]
- 변형: [[DFMEA]] · [[PFMEA]] · [[FMECA]] · [[ML-FMEA]]
- 응용: [[ISO-26262]] · [[DO-178C]] · [[Six-Sigma]] · [[SRE]]
- Adjacent: [[Fault-Tree-Analysis]] · [[STPA]] · [[HAZOP]] · [[Bow-Tie-Analysis]] · [[Chaos-Engineering]]
## 🤖 LLM 활용
**언제**: 매 new system 의 risk register 를 brainstorm; 매 architecture review 의 failure-chain 의 enumeration; 매 ML deployment 의 pre-mortem.
**언제 X**: 매 emergent / interactive failure (매 complex software) — 매 STPA 의 더 적합. 매 statistical reliability 는 FTA + Markov.
## ❌ 안티패턴
- **RPN multiplication only**: 매 (10,1,1)=10 vs (2,5,1)=10 의 same — but severity 10 의 catastrophic. **AP matrix 사용.**
- **Sev/Occ/Det 의 inconsistent scale**: 매 team-wide rubric 없으면 매 garbage.
- **One-shot document**: 매 living document 가 아니면 매 outdated. 매 design change 의 trigger update.
- **Skipping detection actions**: 매 only "add training" — 매 weak. 매 sensor / monitor / poka-yoke 의 추가.
- **Software FMEA 의 component-only**: 매 interaction failures 의 missed — 매 STPA 의 complement.
## 🧪 검증 / 중복
- Verified (MIL-P-1629; AIAG-VDA FMEA Handbook 2019; SAE J1739; ISO 26262-9).
- 신뢰도 A.
## 🕓 Changelog
| 날짜 | 변경 |
|---|---|
| 2026-05-08 | Phase 1 placeholder |
| 2026-05-10 | Manual cleanup — 7-step AIAG-VDA + 5 patterns + ML-FMEA |