chore(wiki): reinforce knowledge batch #6-#10 (200 docs milestone)
This commit is contained in:
@@ -1,31 +1,29 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-COTH-001
|
||||
id: CONTROL-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 0.95
|
||||
tags: [auto-reinforced, control-theory, engineering, feedback-loops, stability, automation]
|
||||
last_reinforced: 2026-04-20
|
||||
confidence_score: 1.0
|
||||
tags: [mathematics, engineering, control-theory, pid, feedback-loop]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Control-Theory]]
|
||||
# [[Control Theory (제어 이론)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "목푯값을 향한 끊임없는 교정: 시스템이 원하는 상태(Setpoint)를 유지하거나 도달할 수 있도록, 현재 상태를 실시간으로 측정하고 오차를 계산하여 입력을 조절하는 피드백 루프의 미학."
|
||||
> "현재의 오차를 측정하여 미래의 행동을 정밀하게 교정하라" — 동역학 시스템의 출력을 원하는 목표 상태로 유지하기 위해 입력을 조정하는 공학적 방법론으로, 피드백 루프와 안정성 분석이 핵심.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
제어 이론(Control-Theory)은 동적 시스템의 거동을 제어하기 위한 수학적 방법론입니다.
|
||||
|
||||
1. **핵심 메커니즘**:
|
||||
* **Feedback Control**: 결과를 관찰하고 입력에 반영하여 오차를 줄임.
|
||||
* **Stability**: 시스템이 발산하지 않고 목푯값 근처에서 안정적으로 유지되는 능력.
|
||||
* **PID 제어 (Proportional-Integral-Derivative)**: 비례, 적분, 미분 연산을 통해 응답 속도와 정확도를 조절하는 가장 대중적인 제어 기법.
|
||||
2. **왜 중요한가?**:
|
||||
* 미사일 유도, 자율주행차의 조향, 화학 공장의 온도 조절부터 인체의 항상성 유지까지 모든 자동화의 근간임. (Homeostasis와 연결)
|
||||
- **추출된 패턴:** 목표값(Desired State)과 현재값(Actual State) 사이의 차이인 오차(Error)를 실시간으로 계산하고, 이를 보정하기 위한 제어 신호를 생성하여 시스템을 안정화하는 피드백 패턴.
|
||||
- **핵심 구성 요소:**
|
||||
- **Open-loop Control:** 피드백 없이 정해진 입력만 전달 (예: 세탁기 타이머).
|
||||
- **Closed-loop Control (Feedback):** 출력을 다시 입력에 반영하여 오차 수정.
|
||||
- **PID Control:** 비례(P), 적분(I), 미분(D) 항의 조합으로 오차를 빠르고 부드럽게 제거.
|
||||
- **Stability:** 시스템이 발산하지 않고 수렴하는지 분석 (예: Lyapunov 안정성).
|
||||
- **의의:** 로봇 공학, 자율주행, 드론 비행 제어, 그리고 강화학습의 이론적 토대.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌**: 과거에는 미리 정해진 수학적 모델(Model-based)에 의존하는 정책이 주류였으나, 현대 정책은 모델 없이 데이터로부터 학습하는 '강화학습 기반 제어 정책'으로 패러다임이 이동함(RL Update). (Reinforcement Learning과 연결)
|
||||
- **정책 변화(RL Update)**: 복잡한 로봇 제어 정책에서, 물리 법칙을 수식으로 푸는 대신 시뮬레이션 환경에서 수만 번 시행착오를 겪으며 최적의 제어를 찾는 'Sim-to-Real 정책'이 표준이 됨.
|
||||
- **과거 데이터와의 충돌:** 고정된 수학 모델에 기반한 고전 제어에서, 최근에는 복잡한 환경에 적응하는 적응 제어(Adaptive Control)와 AI를 결합한 지능형 제어로 진화.
|
||||
- **정책 변화:** Skybound 프로젝트의 미사일 추적 로직은 PID 제어 원리를 사용하여, 타겟의 움직임 변화에 부드럽고 정확하게 대응하도록 구현함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Homeostasis (항상성)]], [[Reinforcement Learning (RL)]], [[Cybernetics]], [[Optimization]], [[Robotics]]
|
||||
- **Modern Tech/Tools**: MATLAB/Simulink, ROS (Robot Operating System), MPC (Model Predictive Control).
|
||||
---
|
||||
- [[Physics-Engine]], [[Reinforcement-Learning]], [[Cybernetics-Foundations]], [[Robotics]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Control-Theory.md]]
|
||||
|
||||
Reference in New Issue
Block a user