37 lines
2.5 KiB
Markdown
37 lines
2.5 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-AGAR-001
|
|
category: Art
|
|
confidence_score: 0.98
|
|
tags: [auto-reinforced, agent-architecture, ai-agents, cognitive-architecture, modular-design]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Agent Architecture|Agent Architecture]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "자율 주행하는 지능의 내부 구조: 단순히 답을 내는 모델을 넘어, 기억(Memory), 계획(Planning), 도구 활용(Tool Use) 기능을 유기적으로 결합하여 독립적으로 미션을 수행하는 에이전트의 뇌 설계."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
에이전트 아키텍처(Agent Architecture)는 인공지능이 환경을 인식하고, 추론하며, 목표 달성을 위해 행동하는 일련의 과정을 구조화한 설계를 의미합니다.
|
|
|
|
1. **AI 에이전트의 4대 구성 요소**:
|
|
* **Brain (The LLM)**: 핵심적인 추론 및 의사결합 엔진.
|
|
* **Planning**: 목표를 하위 태스크로 분해(Task Decomposition) 및 자가 성찰(Self-reflection).
|
|
* **Memory**:
|
|
* **Short-term**: 현재 대화의 맥락 (Context Window).
|
|
* **Long-term**: 외부 데이터베이스 연결 (RAG, Vector DB).
|
|
* **Tools (Action)**: 코드를 실행하거나 API를 호출하여 현실 세계에 영향을 미치는 수단.
|
|
2. **아키텍처 패턴**:
|
|
* **ReAct**: Reason + Act를 순차적으로 반복하여 문제 해결.
|
|
* **Plan-and-Execute**: 전체 계획을 먼저 세우고 하나씩 실행.
|
|
* **Multi-Agent**: 전문화된 여러 에이전트가 협업하는 구조.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 하나의 거대 모델이 모든 걸 다 하는 'Single-model' 정책이었으나, 현대의 고난도 태스크 수행 정책은 각 기능을 모듈화하고 순차적으로 연결하는 '에이전틱 워크플로우(Agentic Workflow) 정책'으로 패러다임을 전환함(RL Update).
|
|
- **정책 변화(RL Update)**: 에이전트의 자율 통제 불능 리스크를 방어하기 위해, 매 행동 단계마다 인간이 승인하거나 규칙을 검증하는 'Human-in-the-loop 에이전트 거버넌스' 정책이 산업 표준으로 채택됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Ps-Reinforce|Ps-Reinforce]], Foundational Models, [[Workflow-Integrity|Workflow-Integrity]], Self-Correction Mechanisms, [[Tool-Usage-Optimization|Tool-Usage-Optimization]]
|
|
- **Modern Tech/Tools**: LangChain, AutoGPT, BabyAGI, Microsoft AutoGen, LangGraph.
|
|
---
|