Files
2nd/10_Wiki/Topics/Linux-Performance-Tuning.md
T
2026-05-02 23:33:34 +09:00

2.5 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
SYS-LINUX-PERF-001 Unified 1.0
infrastructure
linux
performance-tuning
sysadmin
Optimization|Optimization
observability
2026-04-26

Linux Performance Tuning (리눅스 성능 튜닝)

📌 한 줄 통찰 (The Karpathy Summary)

"하드웨어의 잠재력을 마지막 한 방울까지 짜내어, 소프트웨어가 질주할 수 있는 최적의 트랙을 닦아라" — 커널 파라미터, 파일 시스템, 네트워크 스택 및 프로세스 스케줄링을 최적화하여 시스템의 처리량(Throughput)을 극대화하고 지연 시간(Latency)을 최소화하는 기술.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: "Resource Bottleneck Identification" — CPU, 메모리, I/O, 네트워크 등 시스템의 4대 핵심 자원을 실시간 모니터링하고, 병목 현상이 발생하는 지점의 커널 설정을 동적으로 조정하여 시스템 전체의 효율을 높이는 최적화 패턴.
  • 주요 튜닝 영역:
    • CPU: 스케줄러 정책(CFS) 조정 및 CPU Affinity 설정을 통해 캐시 적중률 향상.
    • memory: Huge Pages 사용으로 TLB 오버헤드 감소, 가상 메모리 스와핑(Swappiness) 최적화.
    • Storage/IO: 디스크 I/O 스케줄러(Deadline, BFQ) 선택 및 파일 시스템 마운트 옵션 조정.
    • Network: TCP 윈도우 사이즈, 백로그 큐 크기 조정을 통한 대량 트래픽 처리 성능 향상.
  • 의의: 고성능 AI 모델 학습이나 실시간 서빙 시스템에서 하드웨어 비용을 절감하면서도 최상의 사용자 경험을 제공하기 위한 필수 인프라 역량.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 단순한 하드웨어 증설(Scale-up)이 해답이던 시절을 지나, 이제는 eBPF와 같은 최신 도구를 활용하여 커널 내부의 동작을 미세하게 분석하고 정밀하게 튜닝하는 '관측 기반 최적화'가 주류가 됨.
  • 정책 변화: Antigravity 프로젝트의 서버 환경은 AI 연산의 특성에 맞춰 대규모 메모리 페이지 할당과 비동기 I/O 처리에 최적화된 리눅스 커널 튜닝 프로파일을 상시 적용함.

🔗 지식 연결 (Graph)

-_system-Design-for-AI-Scale, High-Availability-Systems, Cloud-Computing-Foundations, GPU-Architecture-for-AI

  • Raw Source: 10_Wiki/Topics/AI/Linux-Performance-Tuning.md