28 lines
1.5 KiB
Markdown
28 lines
1.5 KiB
Markdown
---
|
|
id: P-REINFORCE-AI-AGENT
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 1.0
|
|
tags: [AI Agent, Autonomy, Planning, Reasoning, Action]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# AI-에이전트-(AI-Agent)
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "단순한 계산기에서 자율적인 일꾼으로." 스스로 목표를 설정하고, 계획을 세우며, 도구(Browser, Terminal 등)를 사용하여 주어진 과업을 끝까지 완수하는 자율적 지능체다.
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
- **Planning & Reasoning**:
|
|
- 거대 언어 모델(LLM)을 두뇌로 삼아 복잡한 문제를 작은 단계로 분해(Chain-of-Thought)하고 전략을 수립한다.
|
|
- **Action & Tool Use**:
|
|
- API 호출, 웹 검색, 코드 실행 등 외부 환경과 상호작용할 수 있는 인터페이스를 통해 실제 세계에 변화를 일으킨다.
|
|
- **Memory Management**:
|
|
- 대화의 맥락(Short-term)과 과거 지식(Long-term)을 RAG나 체크포인트 형태로 유지하여 일관된 수행 능력을 보유한다.
|
|
|
|
## ⚠️ 모순 및 업데이트 (RL Update)
|
|
- 현재의 에이전트는 '무한 루프'나 '환각'에 빠질 위험이 크다. 이를 극복하기 위해 에이전트가 자신의 결과물을 스스로 검토하는 'Self-Correction' 루프와, 인간이 중간에 개입하는 'Human-in-the-loop' 설계가 필수적이다.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- Related: Multi-Agent-System-(다중-에이전트-시스템) , Agent-Communication-Protocol-(에이전트-통신-규약)
|
|
- Deployment: [[Deployment_Final_Gate]]
|