[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -2,7 +2,7 @@
|
||||
id: SYS-SERVERLESS-AI-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, infrastructure, serverless, cloud-computing, faas, aws-lambda, scalability, mlops]
|
||||
tags: [ai, infrastructure, serverless, cloud-computing, faas, aws-lambda, [[Scalability]], [[MLOps]]]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
@@ -14,9 +14,9 @@ last_reinforced: 2026-04-26
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Event-driven Inference and Pay-per-invocation" — 서버를 상시 가동하는 대신 특정 이벤트(API 호출, 데이터 업로드 등)가 발생할 때만 컨테이너를 띄워 AI 연산을 수행하고 즉시 자원을 반납하는 효율성 중심의 운영 패턴.
|
||||
- **주요 특징 및 장점:**
|
||||
- **No Server Management:** 패치, 업데이트, 용량 계획 등 운영 부담 전무.
|
||||
- **No Server [[Management]]:** 패치, 업데이트, 용량 계획 등 운영 부담 전무.
|
||||
- **Elastic Scalability:** 수천 개의 동시 요청에도 자동 확장(Auto-scaling) 대응.
|
||||
- **Cost Efficiency:** 실행 시간과 메모리 사용량에 대해서만 비용 청구.
|
||||
- **Cost [[Efficiency]]:** 실행 시간과 메모리 사용량에 대해서만 비용 청구.
|
||||
- **한계점:**
|
||||
- **Cold Start:** 오랜만에 실행할 때 발생하는 초기 지연 시간.
|
||||
- **Execution Limits:** 실행 시간 및 메모리 용량의 제한.
|
||||
|
||||
Reference in New Issue
Block a user