1.8 KiB
1.8 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | ||||
|---|---|---|---|---|---|---|---|---|
| P-REINFORCE-AI-MPC | 10_Wiki/💡 Topics/AI | 0.98 |
|
2026-04-20 |
Model-Predictive-Control (MPC) (모델 예측 제어)
📌 한 줄 통찰 (The Karpathy Summary)
"몇 수 앞을 내다보고 현재의 핸들을 꺾는 지능형 조타수." 시스템의 수학적 모델을 사용해 미래의 거동을 예측하고, 수천 번의 가공 시뮬레이션을 통해 현재 시점에서 최선의 제어 입력을 결정하는 고도의 제어 알고리즘이다.
📖 구조화된 지식 (Synthesized Content)
- Mechanism:
- 현재 상태를 측정함.
- 일정 기간(Prediction Horizon) 동안 시스템이 어떻게 움직일지 미래를 예측함.
- 제약 조건(예: 속도 100km 제한)을 만족하면서 가장 목표에 근접하는 입력 시퀀스를 계산.
- 계산된 여러 수 중 첫 번째 명령만 실행하고 다시 1번으로 돌아감 (Receding Horizon).
- Strength: 여러 개의 입력과 출력이 얽힌 복잡한 시스템(MIMO)을 다루는 데 탁월하며, 제약 조건을 하드코딩으로 반영할 수 있다.
- Domain: 정유 공정, 우주선 도킹, 고성능 자율주행 차량.
⚠️ 모순 및 업데이트 (RL Update)
- MPC는 매 순간 최적화 문제를 풀어야 하므로 계산 성능이 엄청나게 소모된다. 최근에는 강화학습(RL)이 MPC의 역할을 대신하거나, 반대로 RL이 갈 방향을 MPC가 제약 조건으로 가이드해주는 하이브리드 제어(Learning-based MPC)가 로보틱스의 새로운 표준이 되고 있다.
🔗 지식 연결 (Graph)
- Related: Control-Theory , Decision Theory
- AI Hybrid: Deep-Reinforcement-Learning-for-Control