---
id: P-REINFORCE-AI-MPC
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.98
tags: [Engineering, ControlTheory, MPC, Predictive]
last_reinforced: 2026-04-20
---

# [[Model-Predictive-Control (MPC)|Model-Predictive-Control (MPC)]] (모델 예측 제어)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "몇 수 앞을 내다보고 현재의 핸들을 꺾는 지능형 조타수." 시스템의 수학적 모델을 사용해 미래의 거동을 예측하고, 수천 번의 가공 시뮬레이션을 통해 현재 시점에서 최선의 제어 입력을 결정하는 고도의 제어 알고리즘이다.

## 📖 구조화된 지식 (Synthesized Content)
- **Mechanism**:
    1. 현재 상태를 측정함.
    2. 일정 기간(Prediction Horizon) 동안 시스템이 어떻게 움직일지 미래를 예측함.
    3. 제약 조건(예: 속도 100km 제한)을 만족하면서 가장 목표에 근접하는 입력 시퀀스를 계산.
    4. 계산된 여러 수 중 **첫 번째 명령만 실행**하고 다시 1번으로 돌아감 (Receding Horizon).
- **Strength**: 여러 개의 입력과 출력이 얽힌 복잡한 시스템(MIMO)을 다루는 데 탁월하며, 제약 조건을 하드코딩으로 반영할 수 있다.
- **Domain**: 정유 공정, 우주선 도킹, 고성능 자율주행 차량.

## ⚠️ 모순 및 업데이트 (RL Update)
- MPC는 매 순간 최적화 문제를 풀어야 하므로 계산 성능이 엄청나게 소모된다. 최근에는 강화학습(RL)이 MPC의 역할을 대신하거나, 반대로 RL이 갈 방향을 MPC가 제약 조건으로 가이드해주는 하이브리드 제어(Learning-based MPC)가 로보틱스의 새로운 표준이 되고 있다.

## 🔗 지식 연결 (Graph)
- Related: [[Control-Theory|Control-Theory]] , [[Decision Theory|Decision Theory]]
- AI Hybrid: Deep-Reinforcement-Learning-for-Control