2.6 KiB
2.6 KiB
id: P-Reinforce-AUTO-AGAR-001 category: Unified confidence_score: 0.98 tags: [auto-reinforced, agent-Architecture, ai-agents, Cognitive-Architecture, Modular-Design] last_reinforced: 2026-04-20
Agent Architecture
📌 한 줄 통찰 (The Karpathy Summary)
"자율 주행하는 지능의 내부 구조: 단순히 답을 내는 모델을 넘어, 기억(memory), 계획(Planning), 도구 활용(Tool Use) 기능을 유기적으로 결합하여 독립적으로 미션을 수행하는 에이전트의 뇌 설계."
📖 구조화된 지식 (Synthesized Content)
에이전트 아키텍처(Agent Architecture)는 인공지능이 환경을 인식하고, 추론하며, 목표 달성을 위해 행동하는 일련의 과정을 구조화한 설계를 의미합니다.
- AI 에이전트의 4대 구성 요소:
- Brain (The LLM): 핵심적인 추론 및 의사결합 엔진.
- Planning: 목표를 하위 태스크로 분해(Task Decomposition) 및 자가 성찰(Self-Reflection).
- Memory:
- Short-term: 현재 대화의 맥락 (Context Window).
- Long-term: 외부 데이터베이스 연결 (RAG, Vector DB).
- Tools (Action): 코드를 실행하거나 API를 호출하여 현실 세계에 영향을 미치는 수단.
- 아키텍처 패턴:
- ReAct: Reason + Act를 순차적으로 반복하여 문제 해결.
- Plan-and-Execute: 전체 계획을 먼저 세우고 하나씩 실행.
- Multi-Agent: 전문화된 여러 에이전트가 협업하는 구조.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 과거에는 하나의 거대 모델이 모든 걸 다 하는 'Single-model' 정책이었으나, 현대의 고난도 태스크 수행 정책은 각 기능을 모듈화하고 순차적으로 연결하는 '에이전틱 워크플로우(Agentic Workflow) 정책'으로 패러다임을 전환함(RL Update).
- 정책 변화(RL Update): 에이전트의 자율 통제 불능 리스크를 방어하기 위해, 매 행동 단계마다 인간이 승인하거나 규칙을 검증하는 'Human-in-the-loop 에이전트 거버넌스' 정책이 산업 표준으로 채택됨.
🔗 지식 연결 (Graph)
- Ps-Reinforce, Foundational Models, Workflow-InteGrity, Self-Correction Mechanisms, Tool-Usage-Optimization
- Modern Tech/Tools: LangChain, AutoGPT, BabyAGI, Microsoft AutoGen, LangGraph.