Amdahl's Law (암달의 법칙, AI 성능의 병목)

📌 Brief Summary

Amdahl's Law는 어떤 시스템의 일부 성능을 개선했을 때, 전체 시스템이 얻을 수 있는 최대 성능 향상은 개선되지 않은 부분(순차적 부분)에 의해 제한된다는 법칙이다. AI 분야에서는 모델의 특정 레이어를 아무리 빠르게 만들어도, 병렬화 불가능한 계산이나 데이터 로딩 속도가 전체 추론 속도의 발목을 잡는 현상을 설명하는 데 사용된다.

---

📖 Core Content

## 1. 공식 및 핵심 원리

- **공식**: $S = \frac{1}{(1-P) + \frac{P}{N}}$
  - $S$: 전체 가속도
  - $P$: 병렬화 가능한 부분의 비율
  - $N$: 개선된 가속 배수 (예: 프로세서 개수)
- **핵심**: 병렬화할 수 없는 **1-P(순차적 부분)**가 전체 성능의 '천장'을 결정한다.

---

## 2. AI 시스템에서의 적용

| 요소 | 적용 사례 | 병목 현상 |
|------|-----------|-----------|
| **추론 (Inference)** | GPU 코어를 수만 개 사용 | 다음 토큰 생성은 이전 토큰에 의존적이므로 '순차적'임. |
| **훈련 (Training)** | 수천 대의 노드 연결 | 노드 간 데이터 통신(Communication) 시간이 가속의 한계를 결정. |
| **RAG (검색 증강)** | LLM 생성 속도 향상 | 외부 데이터베이스에서 문서를 찾는 속도가 전체 답변 지연 시간 결정. |

---

## 3. 암달의 법칙과 AI의 한계

- **순차적 사고의 벽**: LLM의 사고 과정이 한 단계 한 단계가 이전 단계의 결과물인 경우(Chain-of-Thought), 아무리 많은 GPU를 부어도 생각의 깊이를 만드는 '시간' 자체를 비약적으로 단축하기는 어려움.
- **Data Loading**: 연산 장치가 무한히 빨라도 스토리에서 메모리로 모델 가중치를 읽어오는 속도(Memory Bandwidth)가 병목이 됨.

---

## 4. 해결 전략: 아키텍처의 혁신

- **Speculative Decoding**: 지능은 낮지만 빠른 모델이 미리 미래의 토큰을 예측하게 하여, 순차 계산의 벽을 일부 무너뜨림.
- **Pipelining**: 작업을 겹쳐서 수행함으로써 빈 공간(Idle time)을 줄임.
- **MoE (Mixture of Experts)**: 모든 뉴런을 쓰지 않고 필요한 부분만 활성화하여 절대적인 연산량 자체를 줄임.

---

## 5. 인과관계 (기술 개선 → 새로운 병목 발견)

```
[시스템의 병렬화 가능한 부분(P) 극격히 개선] (GPU 코어 증가)
        ↓
[병렬 부분의 처리 시간 소멸]
        ↓
[개선 불가능한 순차 부분(1-P)의 비중이 상대적으로 커짐]
        ↓
[전체 가속도가 정체되는 한계수익 체감 지점 도달] (암달의 벽)
        ↓
[단순 확장이 아닌 구조적 혁신(Architecture Shift) 요구]
        ↓
[결과] 컴퓨팅 자원의 비효율성을 극복하기 위한 저전력/고효율 기술의 발전 촉발
```

---

🔗 Knowledge Connections

- [[Diminishing Returns (한계 수익 체감)|Diminishing Returns (한계 수익 체감)]], Scaling Laws (스케일링 법칙), MoE (Mixture of Experts), [[Adaptive Compute (적응형 계산량 조절)|Adaptive Compute (적응형 계산량 조절)]]
- **Projects/Contexts:** AI 추론 가속화 및 하드웨어 최적화
- **Contradictions/Notes:**
  - **Gustafson's Law**: 암달의 법칙이 고정된 작업량에 대한 효율을 따진다면, 구스타프슨의 법칙은 가용한 자원에 맞춰 작업량을 늘리면 성능 향상이 계속될 수 있음을 시사함.
  - **신규 키워드**: `Bottleneck`, `Memory Wall`, `Bandwidth`, `Serial Processing` → 탐색 큐 추가.