[G1-Sync] Manual knowledge update

2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
@@ -1,5 +1,5 @@
 ---
-id: P-REINFORCE-AUTO-COSE-001
+id: [[P-Reinforce]]-AUTO-COSE-001
 category: "10_Wiki/💡 Topics/AI"
 confidence_score: 0.95
 tags: [auto-reinforced, control-systems, engineering, feedback, pid-control, automation, dynamical-systems]
@@ -23,8 +23,8 @@ last_reinforced: 2026-04-20
    *   자율주행차의 조향부터 원자로의 온도 조절, 로봇의 균형 잡기까지 현대 문명의 모든 '자동화'가 이 이론 위에 서 있기 때문임. (Automation와 연결)

 ## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 시스템의 모든 수학적 모델 정책을 완벽히 알아야 한다는 고전 제어(Classic Control) 정책이 주류였으나, 현대 정책은 모델을 몰라도 데이터로 배우는 '모델 프리 강화학습 정책(Model-free RL)'과 결합하여 훨씬 복합적인 제어 정책을 수행함(RL Update). (Reinforcement Learning (RL)와 연결)
- **정책 변화(RL Update)**: 이제는 단순 물리 시스템 제어 정책을 넘어, 거대 AI 모델의 답변 정책(Alignment)을 제어하거나 사회적 시스템의 변동성 정책을 제어하는 광의의 제어 정책으로 확장 중임.
+- **과거 데이터와의 충돌**: 과거에는 시스템의 모든 수학적 모델 정책을 완벽히 알아야 한다는 고전 제어(Classic Control) 정책이 주류였으나, 현대 정책은 모델을 몰라도 데이터로 배우는 '모델 프리 강화학습 정책(Model-free RL)'과 결합하여 훨씬 복합적인 제어 정책을 수행함(RL Update). ([[Reinforcement Learning (RL)]]와 연결)
+- **정책 변화(RL Update)**: 이제는 단순 물리 시스템 제어 정책을 넘어, 거대 AI 모델의 답변 정책([[Alignment]])을 제어하거나 사회적 시스템의 변동성 정책을 제어하는 광의의 제어 정책으로 확장 중임.

 ## 🔗 지식 연결 (Graph)
 - Automation, [[Reinforcement Learning (RL)]], [[System-Theory]], [[Robotics]], [[Efficiency]]