---
id: P-REINFORCE-AUTO-AGAR-001
category: Art
confidence_score: 0.98
tags: [auto-reinforced, agent-architecture, ai-agents, cognitive-architecture, modular-design]
last_reinforced: 2026-04-20
---

# [[Agent Architecture|Agent Architecture]]

## 📌 한 줄 통찰 (The Karpathy Summary)
> "자율 주행하는 지능의 내부 구조: 단순히 답을 내는 모델을 넘어, 기억(Memory), 계획(Planning), 도구 활용(Tool Use) 기능을 유기적으로 결합하여 독립적으로 미션을 수행하는 에이전트의 뇌 설계."

## 📖 구조화된 지식 (Synthesized Content)
에이전트 아키텍처(Agent Architecture)는 인공지능이 환경을 인식하고, 추론하며, 목표 달성을 위해 행동하는 일련의 과정을 구조화한 설계를 의미합니다.

1.  **AI 에이전트의 4대 구성 요소**:
    *   **Brain (The LLM)**: 핵심적인 추론 및 의사결합 엔진.
    *   **Planning**: 목표를 하위 태스크로 분해(Task Decomposition) 및 자가 성찰(Self-reflection).
    *   **Memory**:
        *   **Short-term**: 현재 대화의 맥락 (Context Window).
        *   **Long-term**: 외부 데이터베이스 연결 (RAG, Vector DB).
    *   **Tools (Action)**: 코드를 실행하거나 API를 호출하여 현실 세계에 영향을 미치는 수단.
2.  **아키텍처 패턴**:
    *   **ReAct**: Reason + Act를 순차적으로 반복하여 문제 해결.
    *   **Plan-and-Execute**: 전체 계획을 먼저 세우고 하나씩 실행.
    *   **Multi-Agent**: 전문화된 여러 에이전트가 협업하는 구조.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 하나의 거대 모델이 모든 걸 다 하는 'Single-model' 정책이었으나, 현대의 고난도 태스크 수행 정책은 각 기능을 모듈화하고 순차적으로 연결하는 '에이전틱 워크플로우(Agentic Workflow) 정책'으로 패러다임을 전환함(RL Update).
- **정책 변화(RL Update)**: 에이전트의 자율 통제 불능 리스크를 방어하기 위해, 매 행동 단계마다 인간이 승인하거나 규칙을 검증하는 'Human-in-the-loop 에이전트 거버넌스' 정책이 산업 표준으로 채택됨.

## 🔗 지식 연결 (Graph)
- [[Ps-Reinforce|Ps-Reinforce]], Foundational Models, [[Workflow-Integrity|Workflow-Integrity]], Self-Correction Mechanisms, [[Tool-Usage-Optimization|Tool-Usage-Optimization]]
- **Modern Tech/Tools**: LangChain, AutoGPT, BabyAGI, Microsoft AutoGen, LangGraph.
---