--- id: HARNESS-RES-2026-05-002 title: API Gateway (LLM/MCP Gateway) category: "10_Wiki/Topics/Infrastructure" status: verified confidence_score: 0.94 tags: [harness, api-gateway, llm-gateway, mcp, security, finops] created_at: 2026-05-05 updated_at: 2026-05-08 --- # API Gateway (LLM/MCP Gateway) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μ—μ΄μ „νŠΈμ™€ μ™ΈλΆ€ 세계λ₯Ό μž‡λŠ” ν†΅μ œλœ κ²€λ¬Έμ†Œ: 닀쀑 LLM λΌμš°νŒ…μ„ ν†΅ν•œ λΉ„μš© μ΅œμ ν™”μ™€ MCP 도ꡬ 접근에 λŒ€ν•œ λ³΄μ•ˆ κ°€λ“œλ ˆμΌμ„ 톡합 κ΄€λ¦¬ν•˜λŠ” μ—μ΄μ „νŠΈ μΈν”„λΌμ˜ 쀑좔." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) * **닀쀑 λͺ¨λΈ λΌμš°νŒ… 및 λΉ„μš© μ΅œμ ν™” (LLM Gateway):** OmniRoute와 같은 닀쀑 제곡자 LLM κ²Œμ΄νŠΈμ›¨μ΄λŠ” μΈν…”λ¦¬μ „νŠΈ λΌμš°νŒ…, λ‘œλ“œ λ°ΈλŸ°μ‹±, μžλ™ λŒ€μ²΄(Fallback), 속도 μ œν•œ, 응닡 캐싱을 μˆ˜ν–‰ν•œλ‹€ [2]. λ‹¨μˆœν•œ μž‘μ—…μ€ μ €λ ΄ν•œ λͺ¨λΈλ‘œ, λ³΅μž‘ν•œ 좔둠은 κ³ μ„±λŠ₯ λͺ¨λΈλ‘œ λΌμš°νŒ…ν•˜μ—¬ 토큰 λΉ„μš©μ„ 40~60%κ°€λŸ‰ μ ˆκ°ν•  수 μžˆλ‹€ [2]. Helicone의 AI Gateway μ—­μ‹œ μ½”λ“œ λ³€κ²½ 없이 μš”μ²­ λΌμš°νŒ…κ³Ό 캐싱 κΈ°λŠ₯을 μ œκ³΅ν•˜μ—¬ λΉ„μš© 좔적과 토큰 λͺ¨λ‹ˆν„°λ§μ„ μ§€μ›ν•œλ‹€ [1]. * **λ³΄μ•ˆ 및 도ꡬ μ ‘κ·Ό ν†΅μ œ (MCP/API Gateway):** μ™ΈλΆ€ 도ꡬ μ‚¬μš© μ‹œ Harness MCP GatewayλŠ” μ™ΈλΆ€ MCP μ„œλ²„ ν˜ΈμΆœμ„ ν”„λ‘μ‹œν•˜κ³  ν•„ν„°λ§ν•˜μ—¬ ν—ˆμš© λͺ©λ‘(Allow-listing) 적용, 속도 μ œν•œ, μ½˜ν…μΈ  검사λ₯Ό ν™œμ„±ν™”ν•œλ‹€ [3]. GitHub의 μ—μ΄μ „νŠΈ μ›Œν¬ν”Œλ‘œμš° λ˜ν•œ λ‚΄λΆ€ λ³΄μ•ˆ μ•„ν‚€ν…μ²˜μ˜ μΌν™˜μœΌλ‘œ MCP κ²Œμ΄νŠΈμ›¨μ΄μ™€ API ν”„λ‘μ‹œλ₯Ό ν™œμš©ν•˜μ—¬ μ—μ΄μ „νŠΈ μ‹€ν–‰ ν™˜κ²½μ„ λ°©μ–΄ν•œλ‹€ [6]. Amazon Bedrock AgentCoreλŠ” μ„œλ²„λ¦¬μŠ€ λŸ°νƒ€μž„ ν™˜κ²½μ—μ„œ 도ꡬ 접근을 μœ„ν•œ μ•ˆμ „ν•œ κ²Œμ΄νŠΈμ›¨μ΄λ₯Ό κΈ°λ³Έ μ œκ³΅ν•œλ‹€ [5]. * **FinOps 및 μ˜ˆμ‚° κ°€λ“œλ ˆμΌ κ°•μ œ:** 인프라 κ²Œμ΄νŠΈμ›¨μ΄λŠ” μ—μ΄μ „νŠΈ μ„œλΉ„μŠ€μ˜ μœ λ‹› μ΄μ½”λ…Έλ―ΉμŠ€λ₯Ό κ΄€λ¦¬ν•˜κΈ° μœ„ν•΄ 루프 및 단계 μ œν•œ, 도ꡬ 호좜 μΊ‘(Cap), μ‹€ν–‰λ‹Ή 토큰 μ˜ˆμ‚°, Wall-clock νƒ€μž„μ•„μ›ƒ, 이상 탐지가 ν¬ν•¨λœ ν…Œλ„ŒνŠΈλ³„ μ˜ˆμ‚° μ œν•œ λ“± 5κ°€μ§€μ˜ ꡬ체적인 μ˜ˆμ‚° κ°€λ“œλ ˆμΌμ„ κ°•μ œν•œλ‹€ [4]. * **개인용 μ—μ΄μ „νŠΈ κ²Œμ΄νŠΈμ›¨μ΄ (Personal Agent Gateway):** OpenHarness 기반의 개인용 μ—μ΄μ „νŠΈ 앱인 'ohmo'의 경우, 자체 μ›Œν¬μŠ€νŽ˜μ΄μŠ€ 내에 `gateway.json`을 두어 μ„ νƒλœ LLM ν”„λ‘œλ°”μ΄λ” ν”„λ‘œν•„κ³Ό μ™ΈλΆ€ 채널(Telegram, Slack, Discord λ“±) 섀정을 μ—°κ²°ν•˜κ³  κ΄€λ¦¬ν•˜λŠ” 역할을 μˆ˜ν–‰ν•œλ‹€ [7, 8]. ## βš–οΈ νŠΈλ ˆμ΄λ“œμ˜€ν”„ 및 고렀사항 * **운영 λ³΅μž‘μ„±κ³Ό μ„Έμ…˜ κ΄€λ¦¬μ˜ 좩돌:** κ²Œμ΄νŠΈμ›¨μ΄λ₯Ό λ„μž…ν•˜λ©΄ λ³΄μ•ˆκ³Ό 운영 νš¨μœ¨μ„±μ΄ 크게 ν–₯μƒλ˜μ§€λ§Œ, μΈν”„λΌμ˜ μ„Έμ…˜ 관리 λ³΅μž‘μ„±μ΄ μ¦κ°€ν•˜λŠ” μ œμ•½μ΄ μžˆλ‹€ [1]. * **μƒνƒœ μœ μ§€μ˜ ν•œκ³„:** MCPλ₯Ό 원격 μ„œλΉ„μŠ€λ‘œ μ‹€ν–‰ν•˜κΈ° μœ„ν•΄ HTTP 전솑을 μ‚¬μš©ν•  경우, μƒνƒœλ₯Ό μœ μ§€ν•΄μ•Ό ν•˜λŠ” μ„Έμ…˜ μ œμ•½(예: `Mcp-Session-Id` 헀더 μœ μ§€)이 λ‘œλ“œ λ°ΈλŸ°μ„œ ν™˜κ²½μ΄λ‚˜ μˆ˜ν‰μ  ν™•μž₯(Horizontal scaling) ꡬ쑰와 μΆ©λŒν•˜λŠ” ν˜„μƒμ΄ λ°œμƒν•œλ‹€ [1]. 이 λ•Œλ¬Έμ— λŒ€κ·œλͺ¨ ν™•μž₯성을 μœ„ν•΄μ„œλŠ” 전솑 계측(Transport layer)μ—μ„œ μ„Έμ…˜ 관리λ₯Ό μ™„μ „νžˆ 뢄리해야 ν•˜λŠ” ꡬ쑰적 ν•œκ³„μ™€ 극볡 κ³Όμ œκ°€ μ‘΄μž¬ν•œλ‹€ [1]. ## πŸ”— 지식 μ—°κ²° (Graph) - **μœ μ‚¬ κ°œλ…**: [[Rate Limiting]], [[Reverse Proxy]] - **κ΄€λ ¨ ν”„λ‘œμ νŠΈ**: [[OpenHarness]], [[ConnectAI]] --- *Last updated: 2026-05-08* ## πŸ› οΈ 적용 사둀 (Applied in summary) ### πŸ”Ž μ½”λ“œλ² μ΄μŠ€ κ·Όκ±° (μžλ™ μΆ”μΆœ β€” E:\Wiki 레포) **μ‹€μ œ κ΅¬ν˜„/μ‚¬μš© μœ„μΉ˜:** - `connectai/src/features/secondBrainTrace.ts:256` β€” [Omitted long matching line] _μžλ™ 생성: code_grounding.mjs Β· μž¬μ‹€ν–‰ μ‹œ 갱신됨_