Files
2nd/01_Archive/2026-04-20/Amdahl's Law (암달의 법칙).md
T

3.5 KiB

Amdahl's Law (암달의 법칙, AI 성능의 병목)

📌 Brief Summary

Amdahl's Law는 어떤 시스템의 일부 성능을 개선했을 때, 전체 시스템이 얻을 수 있는 최대 성능 향상은 개선되지 않은 부분(순차적 부분)에 의해 제한된다는 법칙이다. AI 분야에서는 모델의 특정 레이어를 아무리 빠르게 만들어도, 병렬화 불가능한 계산이나 데이터 로딩 속도가 전체 추론 속도의 발목을 잡는 현상을 설명하는 데 사용된다.


📖 Core Content

1. 공식 및 핵심 원리

  • 공식: S = \frac{1}{(1-P) + \frac{P}{N}}
    • S: 전체 가속도
    • P: 병렬화 가능한 부분의 비율
    • N: 개선된 가속 배수 (예: 프로세서 개수)
  • 핵심: 병렬화할 수 없는 **1-P(순차적 부분)**가 전체 성능의 '천장'을 결정한다.

2. AI 시스템에서의 적용

요소 적용 사례 병목 현상
추론 (Inference) GPU 코어를 수만 개 사용 다음 토큰 생성은 이전 토큰에 의존적이므로 '순차적'임.
훈련 (Training) 수천 대의 노드 연결 노드 간 데이터 통신(Communication) 시간이 가속의 한계를 결정.
RAG (검색 증강) LLM 생성 속도 향상 외부 데이터베이스에서 문서를 찾는 속도가 전체 답변 지연 시간 결정.

3. 암달의 법칙과 AI의 한계

  • 순차적 사고의 벽: LLM의 사고 과정이 한 단계 한 단계가 이전 단계의 결과물인 경우(Chain-of-Thought), 아무리 많은 GPU를 부어도 생각의 깊이를 만드는 '시간' 자체를 비약적으로 단축하기는 어려움.
  • Data Loading: 연산 장치가 무한히 빨라도 스토리에서 메모리로 모델 가중치를 읽어오는 속도(Memory Bandwidth)가 병목이 됨.

4. 해결 전략: 아키텍처의 혁신

  • Speculative Decoding: 지능은 낮지만 빠른 모델이 미리 미래의 토큰을 예측하게 하여, 순차 계산의 벽을 일부 무너뜨림.
  • Pipelining: 작업을 겹쳐서 수행함으로써 빈 공간(Idle time)을 줄임.
  • MoE (Mixture of Experts): 모든 뉴런을 쓰지 않고 필요한 부분만 활성화하여 절대적인 연산량 자체를 줄임.

5. 인과관계 (기술 개선 → 새로운 병목 발견)

[시스템의 병렬화 가능한 부분(P) 극격히 개선] (GPU 코어 증가)
        ↓
[병렬 부분의 처리 시간 소멸]
        ↓
[개선 불가능한 순차 부분(1-P)의 비중이 상대적으로 커짐]
        ↓
[전체 가속도가 정체되는 한계수익 체감 지점 도달] (암달의 벽)
        ↓
[단순 확장이 아닌 구조적 혁신(Architecture Shift) 요구]
        ↓
[결과] 컴퓨팅 자원의 비효율성을 극복하기 위한 저전력/고효율 기술의 발전 촉발

🔗 Knowledge Connections