Files
2nd/10_Wiki/Topics_Blog/P-Reinforce.md
T

1.5 KiB

id, category, confidence_score, tags, last_reinforced, github_commit
id category confidence_score tags last_reinforced github_commit
550e8400-e29b-41d4-a716-446655440000 10_Wiki/Topics/Agent & AI 1.0
Agent
AI
Wiki
Reinforcement Learning
Karpathy
2026-04-21 initial

P-Reinforce

📌 한 줄 통찰 (The Karpathy Summary)

파편화된 정보를 자율적으로 구조화하고 연결하여 스스로 성장하는 '외부 뇌'를 구축하는 강화학습 기반 지식 엔진.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: Karpathy의 LLM-Wiki 아키텍처를 실전 에이전트 스킬로 구현하여, 지식의 엔트로피를 낮추고 연결성을 극대화함.
  • 세부 내용:
    • RL Logic: R = w_1(Accuracy) + w_2(Connectivity) + w_3(Satisfaction) 공식을 통해 최적의 폴더링 수행.
    • Autonomous Folderling: 85% 이상의 유사도 시 기존 폴더 배치, 신규 개념 등장 시 즉시 카테고리 확장.
    • Git Sync: 모든 지식의 변화를 GitHub 타임라인에 영속적으로 기록.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 기존 수동 위키 관리 방식의 정적 구조 한계를 극복하고 동적 그래프 구조로 전환.
  • 정책 변화: 사용자의 "이 폴더 아니야" 피드백을 수집하여 20_Meta/Policy.md에 반영, 경계선(Boundary)을 재설정함.

🔗 지식 연결 (Graph)

  • Parent: Agent Ecosystem
  • Related: Knowledge Automation, Recursive Structuring
  • Raw Source: 00_Raw/2026-04-21-P-Reinforce_Skill_Info