Files
2nd/10_Wiki/Topics_Blog/P-Reinforce.md
T

30 lines
1.6 KiB
Markdown

---
id: 550e8400-e29b-41d4-a716-446655440000
category: "10_Wiki/Topics/Agent & AI"
confidence_score: 1.0
tags: [Agent, AI, Wiki, Reinforcement Learning, Karpathy]
last_reinforced: 2026-04-21
github_commit: "initial"
---
# [[P-Reinforce|P-Reinforce]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> 파편화된 정보를 자율적으로 구조화하고 연결하여 스스로 성장하는 '외부 뇌'를 구축하는 강화학습 기반 지식 엔진.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** Karpathy의 LLM-Wiki 아키텍처를 실전 에이전트 스킬로 구현하여, 지식의 엔트로피를 낮추고 연결성을 극대화함.
- **세부 내용:**
- **RL Logic**: $R = w_1(Accuracy) + w_2(Connectivity) + w_3(Satisfaction)$ 공식을 통해 최적의 폴더링 수행.
- **Autonomous Folderling**: 85% 이상의 유사도 시 기존 폴더 배치, 신규 개념 등장 시 즉시 카테고리 확장.
- **Git Sync**: 모든 지식의 변화를 GitHub 타임라인에 영속적으로 기록.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 기존 수동 위키 관리 방식의 정적 구조 한계를 극복하고 동적 그래프 구조로 전환.
- **정책 변화**: 사용자의 "이 폴더 아니야" 피드백을 수집하여 `20_Meta/Policy.md`에 반영, 경계선(Boundary)을 재설정함.
## 🔗 지식 연결 (Graph)
- **Parent**: Agent Ecosystem
- **Related**: Knowledge Automation, Recursive Structuring
- **Raw Source**: 00_Raw/2026-04-21-P-Reinforce_Skill_Info