# [[Agentic Software Engineering]] ## ๐Ÿ“Œ Brief Summary ์—์ด์ „ํ‹ฑ ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง(Agentic Software Engineering)์€ ๊ฐœ๋ฐœ์ž๊ฐ€ ์ง์ ‘ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜๋Š” ์—ญํ• ์—์„œ ์ฝ”๋“œ๋ฅผ ์ž์œจ์ ์œผ๋กœ ์ž‘์„ฑํ•˜๋Š” AI ์—์ด์ „ํŠธ๋ฅผ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜ํ•˜๊ณ  ๋ฐฉํ–ฅ์„ ์„ค์ •ํ•˜๋Š” ์—ญํ• ๋กœ ์ง„ํ™”ํ•˜๋Š” ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ํŒจ๋Ÿฌ๋‹ค์ž„์ž…๋‹ˆ๋‹ค [1-3]. ์ด ํ™˜๊ฒฝ์—์„œ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ๋‹จ์ผ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด ์ž์œจ์ ์œผ๋กœ ๊ณ„ํš์„ ์„ธ์šฐ๊ณ  ์ฝ”๋“œ๋ฅผ ๋””๋ฒ„๊น…ํ•˜๋ฉฐ ์†Œํ”„ํŠธ์›จ์–ด ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•˜๋Š” ์—์ด์ „ํŠธ๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค [4, 5]. ์ด๋Ÿฌํ•œ ์—์ด์ „ํŠธ๊ฐ€ ํ™˜๊ฐ์ด๋‚˜ ํƒˆ์„  ์—†์ด ์‹ ๋ขฐ์„ฑ ์žˆ๊ฒŒ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ์‹คํ–‰ ํ™˜๊ฒฝ, ๋„๊ตฌ ์ œ์–ด, ๋ฉ”๋ชจ๋ฆฌ, ์•ˆ์ „์žฅ์น˜ ๋“ฑ์„ ์ œ๊ณตํ•˜๋Š” '์—์ด์ „ํŠธ ํ•˜๋„ค์Šค ์—”์ง€๋‹ˆ์–ด๋ง(Agent Harness Engineering)'์ด ์ด ํŒจ๋Ÿฌ๋‹ค์ž„์˜ ํ•ต์‹ฌ ์ธํ”„๋ผ ๊ธฐ๋ฐ˜์„ ํ˜•์„ฑํ•ฉ๋‹ˆ๋‹ค [6-8]. ## ๐Ÿ“– Core Content * **๊ฐœ๋ฐœ์ž ์—ญํ• ์˜ ๋ณ€ํ™” (From Implementer to Orchestrator)**: 2026๋…„ ์ดํ›„ ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ์˜ ํ•ต์‹ฌ์€ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๊ฒƒ(syntax)์—์„œ AI ์—์ด์ „ํŠธ๊ฐ€ ์•ˆ์ „ํ•˜๊ฒŒ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•  ์ˆ˜ ์žˆ๋„๋ก ์•„ํ‚คํ…์ฒ˜์™€ ์ œ์–ด ์‹œ์Šคํ…œ์„ ์„ค๊ณ„ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋ณ€ํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค [1-3]. ์ธ๊ฐ„์€ ๊ณ ์ฐจ์›์ ์ธ ์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„์™€ ๊ฒฐ๊ณผ๋ฌผ ๊ฒ€์ฆ ๋ฐ ์ „๋žต์  ๋ฐฉํ–ฅ ์ง€์‹œ์— ์ง‘์ค‘ํ•˜๊ณ , ์—์ด์ „ํŠธ๋Š” ๋ฐ˜๋ณต์ ์ด๊ณ  ์ „์ˆ ์ ์ธ ๊ตฌํ˜„์„ ๋‹ด๋‹นํ•ฉ๋‹ˆ๋‹ค [1, 2]. * **์—์ด์ „ํŠธ ํ•˜๋„ค์Šค์˜ ํ•„์ˆ˜์„ฑ (The Necessity of Agent Harnesses)**: LLM ์ž์ฒด๋Š” ์ƒํƒœ(State)๋ฅผ ์œ ์ง€ํ•˜๊ฑฐ๋‚˜ ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•˜๊ฑฐ๋‚˜ ์™ธ๋ถ€ API๋ฅผ ํ˜ธ์ถœํ•  ์ˆ˜ ์—†๋Š” ๋‹จ์ˆœํ•œ ํ™•๋ฅ ์  ์ถ”๋ก  ์—”์ง„์— ๋ถˆ๊ณผํ•ฉ๋‹ˆ๋‹ค [6, 9, 10]. ์ด๋ฅผ ์ž์œจ์ ์ธ ์ฝ”๋”ฉ ์—์ด์ „ํŠธ๋กœ ๋ณ€ํ™˜ํ•˜๋ ค๋ฉด ์‹คํ–‰ ๋ฃจํ”„(E), ๋„๊ตฌ ๋ ˆ์ง€์ŠคํŠธ๋ฆฌ(T), ์ปจํ…์ŠคํŠธ ๊ด€๋ฆฌ์ž(C), ์ƒํƒœ ์ €์žฅ์†Œ(S), ์ˆ˜๋ช…์ฃผ๊ธฐ ํ›…(L), ํ‰๊ฐ€ ์ธํ„ฐํŽ˜์ด์Šค(V) ๋“ฑ 6๊ฐ€์ง€ ๊ฑฐ๋ฒ„๋„Œ์Šค ๊ตฌ์„ฑ ์š”์†Œ๋ฅผ ์ œ๊ณตํ•˜๋Š” 'ํ•˜๋„ค์Šค(Harness)' ์ธํ”„๋ผ๊ฐ€ ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค [7, 8, 11, 12]. * **๋‹ค์ค‘ ์—์ด์ „ํŠธ ๋ฐ PEV ๋ฃจํ”„ (Multi-agent & PEV Loop)**: ๋ณต์žกํ•œ ์ฝ”๋“œ ์ž‘์„ฑ ์ž‘์—…์€ ๊ณ„ํš(Plan), ์‹คํ–‰(Execute), ๊ฒ€์ฆ(Verify)์œผ๋กœ ์—ญํ• ์„ ๋ถ„๋ฆฌํ•˜๋Š” PEV ๋ฃจํ”„๋‚˜ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜(Orchestrator-worker ํŒจํ„ด ๋“ฑ)์„ ํ†ตํ•ด ๊ด€๋ฆฌ๋ฉ๋‹ˆ๋‹ค [13-15]. ์ด๋ฅผ ํ†ตํ•ด ์—์ด์ „ํŠธ๋Š” ํ™˜๊ฐ์ด๋‚˜ ์ž‘์—… ์ดํƒˆ ์—†์ด ๋ช…์‹œ์ ์ธ ๊ณ„ํš๊ณผ ๋ฆฐํ„ฐ(Linter), CI ๊ฒ€์‚ฌ์™€ ๊ฐ™์€ ๊ธฐ๊ณ„์ ์ธ ์Šน์ธ ์ ˆ์ฐจ ๋‚ด์—์„œ๋งŒ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค [13, 14, 16]. * **์‹คํ–‰ ํ™˜๊ฒฝ ๋ฐ ์ƒŒ๋“œ๋ฐ•์Šค (Execution Environments & Sandboxing)**: ์ฝ”๋”ฉ ์—์ด์ „ํŠธ๋Š” ์ปจํ…Œ์ด๋„ˆ๋‚˜ ๋งˆ์ดํฌ๋กœ VM๊ณผ ๊ฐ™์€ ๊ฒฉ๋ฆฌ๋œ ์ƒŒ๋“œ๋ฐ•์Šค ํ™˜๊ฒฝ์—์„œ ํŒŒ์ผ ์ฝ๊ธฐ/์“ฐ๊ธฐ, ์…ธ ๋ช…๋ น์–ด ์‹คํ–‰, LSP(Language Server Protocol)๋ฅผ ํ†ตํ•œ ์‹œ๋งจํ‹ฑ ์ฝ”๋“œ ๋ถ„์„ ๋“ฑ์˜ ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค [17-19]. ๋˜ํ•œ, ๋ฆฌ์†Œ์Šค ์†Œ๋ชจ๊ฐ€ ํฐ ๋ฌผ๋ฆฌ์  Docker ํ™˜๊ฒฝ ๋Œ€์‹ , LLM์„ ํ™œ์šฉํ•˜์—ฌ ์ฝ”๋“œ ์‹คํ–‰ ๊ฒฐ๊ณผ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ณ  ๊ฒ€์ฆํ•˜๋Š” 'SWE-World'์™€ ๊ฐ™์€ ๋„์ปค ํ”„๋ฆฌ(Docker-Free) ๊ฐ€์ƒ ํ•˜๋„ค์Šค ํ™˜๊ฒฝ๋„ ์—์ด์ „ํŠธ ํ›ˆ๋ จ ๋ฐ ํ‰๊ฐ€์— ์ ๊ทน ํ™œ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค [20-22]. ## โš–๏ธ Trade-offs & Caveats * **์ž์œจ์„ฑ(Capability)๊ณผ ๊ฒฉ๋ฆฌ/๋ณด์•ˆ(Security/Isolation) ๊ฐ„์˜ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„**: ์ฝ”๋”ฉ ์—์ด์ „ํŠธ๊ฐ€ ํ˜„์‹ค์ ์ธ ์—”์ง€๋‹ˆ์–ด๋ง ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ ค๋ฉด ์…ธ ๋ช…๋ น์–ด ์‹คํ–‰์ด๋‚˜ ํŒŒ์ผ ์‹œ์Šคํ…œ ์ ‘๊ทผ๊ณผ ๊ฐ™์€ ๊ด‘๋ฒ”์œ„ํ•œ ๋„๊ตฌ ๊ถŒํ•œ์ด ํ•„์š”ํ•˜์ง€๋งŒ, ์ด๋Š” ๊ฐ„์ ‘ ํ”„๋กฌํ”„ํŠธ ์ธ์ ์…˜(Indirect Prompt Injection)์ด๋‚˜ ์ƒŒ๋“œ๋ฐ•์Šค ํƒˆ์ถœ๊ณผ ๊ฐ™์€ ์‹ฌ๊ฐํ•œ ์‹œ์Šคํ…œ ๋ณด์•ˆ ์ทจ์•ฝ์ ์„ ๋ฐœ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค [23, 24]. ๋ฐ˜๋Œ€๋กœ ๊ฐ•๋ ฅํ•œ ๋ณด์•ˆ ๋ฐ ๊ฒฉ๋ฆฌ ์กฐ์น˜(์˜ˆ: ์—„๊ฒฉํ•œ ๋งˆ์ดํฌ๋กœ VM ํ™˜๊ฒฝ ์ ์šฉ)๋ฅผ ๊ฐ•์ œํ•˜๋ฉด ์—์ด์ „ํŠธ์˜ ์ง€์—ฐ ์‹œ๊ฐ„๊ณผ ์šด์˜ ๋น„์šฉ์ด ํฌ๊ฒŒ ์ฆ๊ฐ€ํ•˜์—ฌ ์™„๋ฒฝํ•œ ํŒŒ๋ ˆํ†  ์ตœ์ ์ (Pareto-optimal point)์„ ์ฐพ๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค [23, 24]. * **์ปจํ…์ŠคํŠธ ๋ณด์กด(Context Retention)๊ณผ ์ปดํ“จํŒ… ๊ฒฝ์ œ์„ฑ(Compute Economics)์˜ ์ƒ์ถฉ**: ์žฅ๊ธฐ ์‹คํ–‰ ์—์ด์ „ํŠธ(Long-running agents)๊ฐ€ ๊ณผ๊ฑฐ์˜ ์ฝ”๋“œ ์ˆ˜์ • ๋‚ด์—ญ๊ณผ ๋„๊ตฌ ์‹คํ–‰ ๊ฒฐ๊ณผ๋ฅผ ๋ชจ๋‘ ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ์— ๋ณด์กดํ•˜๋„๋ก ํ•˜๋ฉด ํ† ํฐ ์†Œ๋น„๋Ÿ‰์ด ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ๋Š˜์–ด๋‚˜ '์ปจํ…์ŠคํŠธ ๋ถ€ํŒจ(Context rot)'๊ฐ€ ๋ฐœ์ƒํ•˜๋ฉฐ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ํฌ์„๋ฉ๋‹ˆ๋‹ค [25-27]. ๋ฐ˜๋Œ€๋กœ ํ† ํฐ ์ตœ์ ํ™”๋ฅผ ์œ„ํ•ด ์ปจํ…์ŠคํŠธ๋ฅผ ๋„ˆ๋ฌด ๊ณต๊ฒฉ์ ์œผ๋กœ ์š”์•ฝ(Compaction)ํ•˜๊ฑฐ๋‚˜ ์‚ญ์ œํ•˜๋ฉด ์—์ด์ „ํŠธ๊ฐ€ ์ด์ „์˜ ๊ฒฐ์ • ๋งฅ๋ฝ์ด๋‚˜ ์ค‘์š”ํ•œ ์ฝ”๋“œ ๋ ˆํผ๋Ÿฐ์Šค๋ฅผ ์ƒ์‹คํ•˜๋Š” ์ •๋ณด ์†์‹ค์˜ ๋ถ€์ž‘์šฉ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค [28, 29]. * **ํ•˜๋„ค์Šค-๋ชจ๋ธ ๊ฒฐํ•ฉ(Harness-Model Coupling) ํŽธํ–ฅ์„ฑ**: ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์˜ ์‹ค์ œ ์‹ ๋ขฐ์„ฑ์ด๋‚˜ ์ฝ”๋“œ ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€ ์ ์ˆ˜๋Š” ๋ชจ๋ธ ๋‹จ๋…์˜ ์ง€๋Šฅ์ด ์•„๋‹ˆ๋ผ ๋ชจ๋ธ๊ณผ ํ•˜๋„ค์Šค ๊ฐ„์˜ ์ƒํ˜ธ์ž‘์šฉ ํ’ˆ์งˆ์— ์˜ํ•ด ํฌ๊ฒŒ ์ขŒ์šฐ๋ฉ๋‹ˆ๋‹ค [30, 31]. ๋™์ผํ•œ ์„ฑ๋Šฅ์˜ ๋ชจ๋ธ์ด๋ผ๋„ ํ•˜๋„ค์Šค์˜ ํ™˜๊ฒฝ ์„ค์ •, ์—๋Ÿฌ ๋ฉ”์‹œ์ง€ ๋ž˜ํ•‘ ๋ฐฉ์‹, ๋„๊ตฌ ์ œ๊ณต ์„ค๊ณ„๊ฐ€ ๋ฏธํกํ•  ๊ฒฝ์šฐ ์ž‘์—…์— ์‹คํŒจํ•  ํ™•๋ฅ ์ด ๋งค์šฐ ๋†’์œผ๋ฉฐ, ์ด๋Š” ํ‰๊ฐ€ ๊ณผ์ •์—์„œ ๋ชจ๋ธ ์ž์ฒด์˜ ๋Šฅ๋ ฅ ๋ถ€์กฑ์œผ๋กœ ์˜ค์ธ๋  ์œ„ํ—˜์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค [32, 33]. ## ๐Ÿ”— Knowledge Connections ### Related Concepts #### [๊ด€๊ณ„ ์œ ํ˜• A (์•„ํ‚คํ…์ฒ˜ ๋ฐ ์ธํ”„๋ผ ๊ธฐ๋ฐ˜ ๊ธฐ์ˆ )] - [[Agent Execution Harness]] - ์—ฐ๊ฒฐ ์ด์œ : ํ…์ŠคํŠธ๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ์–ธ์–ด ๋ชจ๋ธ์„ ์ž์œจ์ ์œผ๋กœ ํ–‰๋™ํ•˜๋Š” ์—์ด์ „ํŠธ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ํ•ต์‹ฌ ๋Ÿฐํƒ€์ž„ ์ œ์–ด ์ธํ”„๋ผ์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค [11, 12, 34]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: ์ƒํƒœ ๋ณด์กด, ์‹คํ–‰ ๋ฃจํ”„ ๊ด€๋ฆฌ, ์ปจํ…์ŠคํŠธ ์ œ์–ด, ๋ณด์•ˆ ๊ฐ•์ œ ๋“ฑ ํ•˜๋„ค์Šค์˜ 6๋Œ€ ๊ฑฐ๋ฒ„๋„Œ์Šค๊ฐ€ ๋ชจ๋ธ ์„ฑ๋Šฅ๊ณผ ์‹ ๋ขฐ์„ฑ์„ ์–ด๋–ป๊ฒŒ ๊ฒฐ์ •์ง“๋Š”์ง€ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [11, 12, 35]. - [[Model Context Protocol (MCP)]] - ์—ฐ๊ฒฐ ์ด์œ : ์—์ด์ „ํŠธ ํ•˜๋„ค์Šค๊ฐ€ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค, ํŒŒ์ผ ์‹œ์Šคํ…œ, ์„œ๋“œํŒŒํ‹ฐ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๋“ฑ ์™ธ๋ถ€ ๋„๊ตฌ์™€ ํ†ต์‹ ํ•˜๋Š” ๋ฐฉ์‹์„ ํ‘œ์ค€ํ™”ํ•˜๋Š” ๊ฐœ๋ฐฉํ˜• ํ”„๋กœํ† ์ฝœ์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค [36-38]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: AI๊ฐ€ ์™ธ๋ถ€ ์‹œ์Šคํ…œ๊ณผ ํˆด์„ ํ˜ธ์ถœํ•˜๋Š” ๋ณต์žกํ•œ ๊ถŒํ•œ ๋ฐ ๋„๊ตฌ ๋ ˆ์ง€์ŠคํŠธ๋ฆฌ ๊ด€๋ฆฌ ๊ตฌ์กฐ๋ฅผ ์ƒํ˜ธ ์šด์šฉ ๊ฐ€๋Šฅํ•œ ํ˜•ํƒœ๋กœ ๋‹จ์ˆœํ™”ํ•˜๋Š” ํ†ตํ•ฉ ์›๋ฆฌ๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [39, 40]. #### [๊ด€๊ณ„ ์œ ํ˜• B (์‹คํ–‰ ์ œ์–ด ๋ฐ ํ‰๊ฐ€ ์•„ํ‚คํ…์ฒ˜ ํŒจํ„ด)] - [[Plan-Execute-Verify (PEV) Loop]] - ์—ฐ๊ฒฐ ์ด์œ : ์ฝ”๋”ฉ ์—์ด์ „ํŠธ๊ฐ€ ๋‹จ์ผ ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์•„๋‹Œ ๊ตฌ์กฐํ™”๋œ ๊ณ„ํš ์ˆ˜๋ฆฝ, ์ œํ•œ๋œ ์‹คํ–‰, ์—„๊ฒฉํ•œ ์ฝ”๋“œ ๊ฒ€์ฆ์„ ๊ฑฐ์น˜๋„๋ก ๊ฐ•์ œํ•˜๋Š” ํ•ต์‹ฌ ํ•˜๋„ค์Šค ์†Œํ”„ํŠธ์›จ์–ด ํŒจํ„ด์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค [13, 14]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: ๋‹จ์ˆœํžˆ ์ฝ”๋“œ๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ํ™•์ธํ•˜๋Š”(Generate-and-check) ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ณ , ์ž๋™ํ™”๋œ ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„๋ฅผ ํ†ตํ•ด ์—์ด์ „ํŠธ์˜ ์‹คํŒจ๋ฅผ ๋ณต๊ตฌํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [14]. - [[SWE-World]] - ์—ฐ๊ฒฐ ์ด์œ : ๋ฆฌ์†Œ์Šค๊ฐ€ ๋งŽ์ด ์†Œ๋ชจ๋˜๋Š” ๋ฌด๊ฑฐ์šด ๋ฌผ๋ฆฌ์  Docker ์‹คํ–‰ ํ™˜๊ฒฝ ๋Œ€์‹ , LLM ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜์—ฌ ์ฝ”๋“œ ํƒ์ƒ‰ ๋ฐ ์œ ๋‹› ํ…Œ์ŠคํŠธ ์‹คํ–‰ ๊ฒฐ๊ณผ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๋Š” ๋„์ปค ํ”„๋ฆฌ(Docker-Free) ์—์ด์ „ํŠธ ํ›ˆ๋ จ ํ”„๋ ˆ์ž„์›Œํฌ์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค [20, 22]. - ์ด ๊ฐœ๋…์„ ํ†ตํ•ด ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ€๋ถ„: ๋น„์šฉ๊ณผ ์ธํ”„๋ผ์˜ ํ•œ๊ณ„๋กœ ์ธํ•ด ๋Œ€๊ทœ๋ชจ ์—์ด์ „ํŠธ ๊ฐ•ํ™”ํ•™์Šต(RL)์ด๋‚˜ ํ‰๊ฐ€๊ฐ€ ์–ด๋ ค์› ๋˜ ๋ฌธ์ œ๋ฅผ, ๊ฐ€์ƒ ํ”ผ๋“œ๋ฐฑ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ํ™•์žฅ์„ฑ ์žˆ๊ฒŒ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [22, 41]. ### Deeper Research Questions - ๋Œ€๊ทœ๋ชจ ๋‹ค์ค‘ ์—์ด์ „ํŠธ(Multi-agent) ์‹œ์Šคํ…œ ํ™˜๊ฒฝ์—์„œ ์—์ด์ „ํŠธ ๊ฐ„์˜ ๊ณต์œ  ์ƒํƒœ(Shared state) ์ผ๊ด€์„ฑ์„ ์œ ์ง€ํ•˜๊ณ , ํ•œ ์—์ด์ „ํŠธ์˜ ๊ฒฐํ•จ์ด๋‚˜ ์˜ค๋ฅ˜๊ฐ€ ๋‹ค๋ฅธ ์—์ด์ „ํŠธ๋กœ ์—ฐ์‡„ ์ „ํŒŒ(Cascading failures)๋˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•œ ํ•˜๋„ค์Šค ๊ณ„์ธต์˜ ๊ฒฉ๋ฆฌ ์•„ํ‚คํ…์ฒ˜๋Š” ์–ด๋–ป๊ฒŒ ์„ค๊ณ„๋˜์–ด์•ผ ํ•˜๋Š”๊ฐ€? [42-44] - 100๋งŒ ํ† ํฐ ์ด์ƒ์˜ ์ดˆ์žฅ๊ธฐ ๋ฌธ๋งฅ(Ultra-long-context) LLM์ด ๋“ฑ์žฅํ–ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์ปจํ…์ŠคํŠธ ์••์ถ•(Compaction)๊ณผ ์ •๋ณด์˜ ํ˜„์ €์„ฑ(Salience) ๊ด€๋ฆฌ๊ฐ€ ์—ฌ์ „ํžˆ ์—์ด์ „ํŠธ ํ•˜๋„ค์Šค ์„ค๊ณ„์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ œ์•ฝ ์กฐ๊ฑด์ด์ž ํ•„์ˆ˜ ์—”์ง€๋‹ˆ์–ด๋ง ์˜์—ญ์œผ๋กœ ์ž‘์šฉํ•˜๋Š” ์‹ค์ฆ์  ์›๋ฆฌ๋Š” ๋ฌด์—‡์ธ๊ฐ€? [45, 46] - ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง ์—์ด์ „ํŠธ๋ฅผ ์œ„ํ•œ ์ฝ”๋“œ ์‹คํ–‰ ์ƒŒ๋“œ๋ฐ•์Šค์—์„œ ์„ฑ๋Šฅ(์ง€์—ฐ ์‹œ๊ฐ„ ์ตœ์†Œํ™” ๋ฐ ์บ์‹œ ์ตœ์ ํ™”)๊ณผ ๋ณด์•ˆ(๋งˆ์ดํฌ๋กœVM ์ˆ˜์ค€์˜ ์ปค๋„ ์ ‘๊ทผ ์ œ์–ด ๋“ฑ) ๊ฐ„์˜ ๊ทน๋‹จ์ ์ธ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ๊ฐ€์žฅ ํšจ์œจ์ ์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” ๋Ÿฐํƒ€์ž„ ์ธํ”„๋ผ ๊ตฌ์„ฑ ๋ฐฉ์•ˆ์€ ๋ฌด์—‡์ธ๊ฐ€? [23, 24] - SWE-bench์™€ ๊ฐ™์€ ์ฝ”๋“œ ํ•ด๊ฒฐ ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€ ์‹œ, ๋ชจ๋ธ ์ž์ฒด์˜ ์ง€๋Šฅ์  ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ํ•˜๋„ค์Šค์˜ ๋ฌผ๋ฆฌ์  ํ™˜๊ฒฝ(์‹คํ–‰ ํ™˜๋ฉด ๋ž˜ํ•‘, ๋„๊ตฌ ์Šคํ‚ค๋งˆ ์ตœ์ ํ™” ๋“ฑ)์ด ์„ฑ๋Šฅ ๊ฒฐ๊ณผ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ์™„์ „ํžˆ ๋ถ„๋ฆฌํ•˜์—ฌ ์ธก์ •ํ•  ์ˆ˜ ์žˆ๋Š” ํ‘œ์ค€ํ™”๋œ ๋ฐฉ๋ฒ•๋ก ์€ ๋ฌด์—‡์ธ๊ฐ€? [32, 33] - ๋Ÿฐํƒ€์ž„์— ๋™์ ์œผ๋กœ ์ƒˆ๋กœ์šด ๋„๊ตฌ๋ฅผ ํƒ์ƒ‰ํ•˜๊ณ  ํ˜ธ์ถœํ•  ์ˆ˜ ์žˆ๋Š” MCP(Model Context Protocol) ํ™˜๊ฒฝ์—์„œ, ์˜ˆ์ƒ์น˜ ๋ชปํ•œ ๋„๊ตฌ ๊ถŒํ•œ์˜ ์กฐํ•ฉ(Capability escalation)์œผ๋กœ ๋ฐœ์ƒํ•˜๋Š” ๊ฐ„์ ‘ ํ”„๋กฌํ”„ํŠธ ์ธ์ ์…˜ ๋“ฑ์˜ ๋ณด์•ˆ ์ทจ์•ฝ์ ์„ ์‚ฌ์ „์— ์ฐจ๋‹จํ•˜๊ธฐ ์œ„ํ•œ ํ•˜๋„ค์Šค ์ˆ˜์ค€์˜ ๊ถŒํ•œ ์ œ์–ด ๋ชจ๋ธ์€ ์–ด๋–ป๊ฒŒ ๊ตฌ์ถ•ํ•ด์•ผ ํ•˜๋Š”๊ฐ€? [47, 48] ### Practical Application Contexts - **Implementation:** ๊ฐœ๋ฐœ์ž๊ฐ€ ๋ช…๋ น์ค„(CLI) ์ธํ„ฐํŽ˜์ด์Šค๋‚˜ IDE์— ํ†ตํ•ฉ๋œ ์—์ด์ „ํŠธ ํ™˜๊ฒฝ(์˜ˆ: OpenDev)์„ ๊ตฌ์ถ•ํ•˜์—ฌ, ์ž์œจ ์ฝ”๋”ฉ ์—์ด์ „ํŠธ๊ฐ€ ๊ฒฉ๋ฆฌ๋œ ์ƒŒ๋“œ๋ฐ•์Šค ๋‚ด์—์„œ ํŒŒ์ผ ํŽธ์ง‘, ๊ตฌ์กฐ์  ๋ฆฐํŒ…, ํ…Œ์ŠคํŠธ ์‹คํ–‰์„ ์•ˆ์ „ํ•˜๊ฒŒ ๋ฐ˜๋ณตํ•˜๋„๋ก ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค [49, 50]. - **System Design:** ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ์‹œ ๊ธฐํš์„ ๋‹ด๋‹นํ•˜๋Š” Planner ์—์ด์ „ํŠธ, ์ฝ”๋“œ๋ฅผ ๊ตฌํ˜„ํ•˜๋Š” Generator ์—์ด์ „ํŠธ, ํ†ตํ•ฉ ํ…Œ์ŠคํŠธ ๋ฐ ๊ฒ€์ฆ์„ ์ˆ˜ํ–‰ํ•˜๋Š” Evaluator ์—์ด์ „ํŠธ๋กœ ์—ญํ• ์„ ์ฒ ์ €ํžˆ ๋ถ„๋ฆฌํ•œ ๋‹ค์ค‘ ์—์ด์ „ํŠธ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜ ํŒŒ์ดํ”„๋ผ์ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค [51-53]. - **Operation / Maintenance:** LangSmith, AgentOps ๋“ฑ์˜ ์ „๋ฌธ ์˜ต์ €๋ฒ„๋นŒ๋ฆฌํ‹ฐ(Observability) ๋ฐ ํ‰๊ฐ€ ๋„๊ตฌ๋ฅผ ์ ์šฉํ•˜์—ฌ ๋Ÿฐํƒ€์ž„ ํ™˜๊ฒฝ์—์„œ ์žฅ๊ธฐ๊ฐ„ ์‹คํ–‰๋˜๋Š” ์—์ด์ „ํŠธ์˜ ์ปจํ…์ŠคํŠธ ์ดˆ๊ณผ ์ƒํƒœ, ๋„๊ตฌ ํ˜ธ์ถœ ์‹คํŒจ์œจ, ๋ฃจํ”„ ์ค‘๋‹จ ์ง€์  ๋“ฑ์„ ํˆฌ๋ช…ํ•˜๊ฒŒ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๊ณ  ์ถ”์ ํ•ฉ๋‹ˆ๋‹ค [54, 55]. - **Learning Path:** ๋‹จ์ˆœํ•œ ์ผํšŒ์„ฑ ํ”„๋กฌํ”„ํŠธ ํŠœ๋‹(Prompt Engineering)์—์„œ ๋ฒ—์–ด๋‚˜, ์—์ด์ „ํŠธ๊ฐ€ ๋ฌธ๋งฅ์„ ์œ ์ง€ํ•˜๋„๋ก ๋•๋Š” ์ปจํ…์ŠคํŠธ ์—”์ง€๋‹ˆ์–ด๋ง(Context Engineering)๊ณผ, ์ตœ์ข…์ ์œผ๋กœ ๋ฆฐํ„ฐ ๊ฐ•์ œ, ๋ฉ”๋ชจ๋ฆฌ ์ง€์†์„ฑ ๋“ฑ์„ ํ†ตํ•ฉํ•ด ์—์ด์ „ํŠธ๋ฅผ ํ†ต์ œํ•˜๋Š” ํ•˜๋„ค์Šค ์—”์ง€๋‹ˆ์–ด๋ง(Harness Engineering)์œผ๋กœ ๊ธฐ์ˆ  ์Šคํƒ๊ณผ ํ•™์Šต ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ง„ํ™”์‹œํ‚ต๋‹ˆ๋‹ค [56, 57]. - **My Project Relevance:** ์†Œ์Šค์— ๊ด€๋ จ ์ •๋ณด๊ฐ€ ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. (๊ฐœ์ธ์˜ ํŠน์ • ํ”„๋กœ์ ํŠธ๋‚˜ ์‚ฌ์  ๋งฅ๋ฝ์— ์—ฐ๊ด€๋œ ๋‚ด์šฉ์€ ์ œ๊ณต๋œ ์†Œ์Šค ๋ฐ์ดํ„ฐ ๋‚ด์— ๊ธฐ์ˆ ๋˜์–ด ์žˆ์ง€ ์•Š์Šต๋‹ˆ๋‹ค). ### Adjacent Topics - [[Retrieval-Augmented Generation (RAG)]] - ํ™•์žฅ ๋ฐฉํ–ฅ: RAG๋Š” ๋‹จ์ˆœํžˆ ์ •์ ์ธ ๋ฌธ์„œ์—์„œ ํ…์ŠคํŠธ๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋ชจ๋ธ์— ์ง€์‹์„ ์ฃผ์ž…ํ•˜๋Š” ์ˆ˜๋™์ ์ธ ๋ฐฉ์‹์ด์—ˆ๋‹ค๋ฉด, ์ด๋ฅผ ๋„˜์–ด ์—์ด์ „ํŠธ๊ฐ€ ์ฝ”๋“œ๋ฒ ์ด์Šค ๊ตฌ์กฐ๋ฅผ ํŒŒ์•…ํ•˜๊ณ  ์—ฌ๋Ÿฌ ๊ฒ€์ƒ‰ ๋„๊ตฌ๋ฅผ ๊ฑฐ์ณ ๋™์ ์œผ๋กœ ์ •๋ณด๋ฅผ ์ง์ ‘ ํš๋“ํ•ด๋‚˜๊ฐ€๋Š” 'Agentic Search(์—์ด์ „ํŠธ์  ํƒ์ƒ‰)' ๋ฐ ์—ฐ์†์  ์ง€์‹ ํ†ตํ•ฉ ์•„ํ‚คํ…์ฒ˜๋กœ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [58-60]. - [[Agent-to-Agent (A2A) Protocol]] - ํ™•์žฅ ๋ฐฉํ–ฅ: MCP๊ฐ€ ๊ฐœ๋ณ„ ์—์ด์ „ํŠธ์™€ ์™ธ๋ถ€ ๋„๊ตฌ/๋ฐ์ดํ„ฐ ๊ฐ„์˜ ์—ฐ๊ฒฐ์„ ๋•๋Š” ํ‘œ์ค€์ด๋ผ๋ฉด, A2A ํ”„๋กœํ† ์ฝœ์€ ์„œ๋กœ ๋‹ค๋ฅธ ํ•˜๋„ค์Šค์— ์†ํ•˜๊ฑฐ๋‚˜ ์›๊ฒฉ์œผ๋กœ ๋ถ„์‚ฐ๋œ ๋‹ค์ˆ˜์˜ ์—์ด์ „ํŠธ ์ธ์Šคํ„ด์Šค ๊ฐ„์— ์ž‘์—…์„ ์œ„์ž„ํ•˜๊ณ  ์ƒํƒœ๋ฅผ ๋™๊ธฐํ™”ํ•˜๋ฉฐ ํ†ต์‹ ํ•˜๊ธฐ ์œ„ํ•œ ์ƒํ˜ธ์šด์šฉ์„ฑ ๋„คํŠธ์›Œํฌ ํ‘œ์ค€ ๊ธฐ์ˆ ๋กœ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค [37, 61]. --- *Last updated: 2026-05-01*