29 lines
1.8 KiB
Markdown
29 lines
1.8 KiB
Markdown
---
|
|
id: [[P-Reinforce|P-Reinforce]]-AI-MPC
|
|
category: Unified
|
|
confidence_score: 0.98
|
|
tags: [Engineering, ControlTheory, MPC, Predictive]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Model-Predictive-Control (MPC)|Model-Predictive-Control (MPC)]] (모델 예측 제어)
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "몇 수 앞을 내다보고 현재의 핸들을 꺾는 지능형 조타수." 시스템의 수학적 모델을 사용해 미래의 거동을 예측하고, 수천 번의 가공 시뮬레이션을 통해 현재 시점에서 최선의 제어 입력을 결정하는 고도의 제어 알고리즘이다.
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
- **Mechanism**:
|
|
1. 현재 상태를 측정함.
|
|
2. 일정 기간(Prediction Horizon) 동안 시스템이 어떻게 움직일지 미래를 예측함.
|
|
3. 제약 조건(예: 속도 100km 제한)을 만족하면서 가장 목표에 근접하는 입력 시퀀스를 계산.
|
|
4. 계산된 여러 수 중 **첫 번째 명령만 실행**하고 다시 1번으로 돌아감 (Receding Horizon).
|
|
- **Strength**: 여러 개의 입력과 출력이 얽힌 복잡한 시스템(MIMO)을 다루는 데 탁월하며, 제약 조건을 하드코딩으로 반영할 수 있다.
|
|
- **Domain**: 정유 공정, 우주선 도킹, 고성능 자율주행 차량.
|
|
|
|
## ⚠️ 모순 및 업데이트 (RL Update)
|
|
- MPC는 매 순간 최적화 문제를 풀어야 하므로 계산 성능이 엄청나게 소모된다. 최근에는 강화학습(RL)이 MPC의 역할을 대신하거나, 반대로 RL이 갈 방향을 MPC가 제약 조건으로 가이드해주는 하이브리드 제어(Learning-based MPC)가 로보틱스의 새로운 표준이 되고 있다.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- Related: [[Control-Theory|Control-Theory]] , [[Decision Theory|Decision Theory]]
|
|
- AI Hybrid: Deep-[[Reinforcement-Learning|Reinforcement-Learning]]-for-Control
|