[P-Reinforce] Inventory items 17-21 fulfilled (Batch 08)
This commit is contained in:
+15
-13
@@ -1,25 +1,27 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-CA155B
|
||||
id: P-REINFORCE-AI-AGENT
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 0.90
|
||||
tags: [auto-reinforced]
|
||||
confidence_score: 1.0
|
||||
tags: [AI Agent, Autonomy, Planning, Reasoning, Action]
|
||||
last_reinforced: 2026-04-20
|
||||
github_commit: "[P-Reinforce] Continuous Worker - AI 에이전트 (AI Agent)"
|
||||
---
|
||||
|
||||
# [[AI 에이전트 (AI Agent)]]
|
||||
# [[AI-에이전트-(AI-Agent)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> 지식 요약 정보 추출 중...
|
||||
> "단순한 계산기에서 자율적인 일꾼으로." 스스로 목표를 설정하고, 계획을 세우며, 도구(Browser, Terminal 등)를 사용하여 주어진 과업을 끝까지 완수하는 자율적 지능체다.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
본문 구조화 작업 중...
|
||||
- **Planning & Reasoning**:
|
||||
- 거대 언어 모델(LLM)을 두뇌로 삼아 복잡한 문제를 작은 단계로 분해(Chain-of-Thought)하고 전략을 수립한다.
|
||||
- **Action & Tool Use**:
|
||||
- API 호출, 웹 검색, 코드 실행 등 외부 환경과 상호작용할 수 있는 인터페이스를 통해 실제 세계에 변화를 일으킨다.
|
||||
- **Memory Management**:
|
||||
- 대화의 맥락(Short-term)과 과거 지식(Long-term)을 RAG나 체크포인트 형태로 유지하여 일관된 수행 능력을 보유한다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
|
||||
- **정책 변화:** AI 분야의 자동 자산화 수행.
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
- 현재의 에이전트는 '무한 루프'나 '환각'에 빠질 위험이 크다. 이를 극복하기 위해 에이전트가 자신의 결과물을 스스로 검토하는 'Self-Correction' 루프와, 인간이 중간에 개입하는 'Human-in-the-loop' 설계가 필수적이다.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
|
||||
- Raw Source: [[00_Raw/2026-04-20/AI 에이전트 (AI Agent).md]]
|
||||
---
|
||||
- Related: [[Multi-Agent-System-(다중-에이전트-시스템)]] , [[Agent-Communication-Protocol-(에이전트-통신-규약)]]
|
||||
- Deployment: [[Deployment_Final_Gate]]
|
||||
|
||||
Reference in New Issue
Block a user