--- id: SYS-SERVERLESS-AI-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [ai, infrastructure, serverless, cloud-computing, faas, aws-lambda, scalability, mlops] last_reinforced: 2026-04-26 --- # Serverless Computing for AI (AIλ₯Ό μœ„ν•œ μ„œλ²„λ¦¬μŠ€ μ»΄ν“¨νŒ…) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μ„œλ²„ κ΄€λ¦¬μ˜ 짐을 ν΄λΌμš°λ“œμ— λ„˜κΈ°κ³  였직 'λͺ¨λΈμ˜ μΆ”λ‘ 'μ—λ§Œ μ§‘μ€‘ν•˜λ©°, 호좜된 만큼만 λΉ„μš©μ„ μ§€λΆˆν•˜λŠ” κ°€μž₯ 경제적이고 μœ μ—°ν•œ μ§€λŠ₯ν˜• 인프라λ₯Ό κ΅¬μΆ•ν•˜λΌ" β€” 인프라 κ΅¬μ„±μ΄λ‚˜ 관리 없이 μ½”λ“œ(ν•¨μˆ˜) λ‹¨μœ„λ‘œ AI λͺ¨λΈμ„ μ‹€ν–‰ν•˜κ³ , μš”μ²­λŸ‰μ— 따라 μžμ›μ΄ μžλ™μœΌλ‘œ ν• λ‹Ήλ˜λŠ” ν΄λΌμš°λ“œ μ»΄ν“¨νŒ… λͺ¨λΈ. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** "Event-driven Inference and Pay-per-invocation" β€” μ„œλ²„λ₯Ό μƒμ‹œ κ°€λ™ν•˜λŠ” λŒ€μ‹  νŠΉμ • 이벀트(API 호좜, 데이터 μ—…λ‘œλ“œ λ“±)κ°€ λ°œμƒν•  λ•Œλ§Œ μ»¨ν…Œμ΄λ„ˆλ₯Ό λ„μ›Œ AI 연산을 μˆ˜ν–‰ν•˜κ³  μ¦‰μ‹œ μžμ›μ„ λ°˜λ‚©ν•˜λŠ” νš¨μœ¨μ„± μ€‘μ‹¬μ˜ 운영 νŒ¨ν„΄. - **μ£Όμš” νŠΉμ§• 및 μž₯점:** - **No Server Management:** 패치, μ—…λ°μ΄νŠΈ, μš©λŸ‰ κ³„νš λ“± 운영 λΆ€λ‹΄ 전무. - **Elastic Scalability:** 수천 개의 λ™μ‹œ μš”μ²­μ—λ„ μžλ™ ν™•μž₯(Auto-scaling) λŒ€μ‘. - **Cost Efficiency:** μ‹€ν–‰ μ‹œκ°„κ³Ό λ©”λͺ¨λ¦¬ μ‚¬μš©λŸ‰μ— λŒ€ν•΄μ„œλ§Œ λΉ„μš© 청ꡬ. - **ν•œκ³„μ :** - **Cold Start:** μ˜€λžœλ§Œμ— μ‹€ν–‰ν•  λ•Œ λ°œμƒν•˜λŠ” 초기 μ§€μ—° μ‹œκ°„. - **Execution Limits:** μ‹€ν–‰ μ‹œκ°„ 및 λ©”λͺ¨λ¦¬ μš©λŸ‰μ˜ μ œν•œ. - **의의:** μŠ€νƒ€νŠΈμ—…μ΄λ‚˜ 개인 κ°œλ°œμžκ°€ λŒ€κ·œλͺ¨ 인프라 투자 없이도 μ „ 세계 μ‚¬μš©μžμ—κ²Œ AI μ„œλΉ„μŠ€λ₯Ό μ•ˆμ •μ μœΌλ‘œ μ œκ³΅ν•  수 μžˆλŠ” μ§„μž… μž₯벽의 ν˜μ‹ . ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** μ΄ˆκΈ°μ—λŠ” κ°€λ²Όμš΄ μ›Ή μš”μ²­ 처리용으둜만 μ—¬κ²¨μ‘ŒμœΌλ‚˜, μ΅œκ·Όμ—λŠ” GPU 지원 μ„œλ²„λ¦¬μŠ€ μ„œλΉ„μŠ€μ™€ μ»¨ν…Œμ΄λ„ˆ 기반 μ„œλ²„λ¦¬μŠ€(Knative λ“±)의 λ“±μž₯으둜 무거운 λ”₯λŸ¬λ‹ λͺ¨λΈ 좔둠도 μ„œλ²„λ¦¬μŠ€ ν™˜κ²½μ—μ„œ ν™œλ°œνžˆ 이루어지고 있음. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” μ—μ΄μ „νŠΈμ˜ 간헐적인 데이터 μ „μ²˜λ¦¬ 및 배치 뢄석 μž‘μ—… μ‹œ, λΉ„μš© μ΅œμ ν™”λ₯Ό μœ„ν•΄ μ„œλ²„λ¦¬μŠ€ μ•„ν‚€ν…μ²˜λ₯Ό μš°μ„ μ μœΌλ‘œ ν™œμš©ν•¨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Scalability-in-AI-Systems]], Cloud-Computing-Foundations, [[Service-oriented-Architecture]], [[Optimization-in-AI]] - **Raw Source:** 10_Wiki/Topics/AI/Serverless-Computing-for-AI.md