bluemsi/2nd

Files

T

koriweb 3d9d0077cc feat: organize and categorize 1535 knowledge assets into wiki topics (2026-04-29)

2026-04-29 18:14:09 +09:00

1.8 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AI-MPC

10_Wiki/💡 Topics/AI

0.98

Engineering

ControlTheory

MPC

Predictive

2026-04-20

Model-Predictive-Control (MPC) (모델 예측 제어)

📌 한 줄 통찰 (The Karpathy Summary)

"몇 수 앞을 내다보고 현재의 핸들을 꺾는 지능형 조타수." 시스템의 수학적 모델을 사용해 미래의 거동을 예측하고, 수천 번의 가공 시뮬레이션을 통해 현재 시점에서 최선의 제어 입력을 결정하는 고도의 제어 알고리즘이다.

📖 구조화된 지식 (Synthesized Content)

Mechanism:
1. 현재 상태를 측정함.
2. 일정 기간(Prediction Horizon) 동안 시스템이 어떻게 움직일지 미래를 예측함.
3. 제약 조건(예: 속도 100km 제한)을 만족하면서 가장 목표에 근접하는 입력 시퀀스를 계산.
4. 계산된 여러 수 중 첫 번째 명령만 실행하고 다시 1번으로 돌아감 (Receding Horizon).
Strength: 여러 개의 입력과 출력이 얽힌 복잡한 시스템(MIMO)을 다루는 데 탁월하며, 제약 조건을 하드코딩으로 반영할 수 있다.
Domain: 정유 공정, 우주선 도킹, 고성능 자율주행 차량.

⚠️ 모순 및 업데이트 (RL Update)

MPC는 매 순간 최적화 문제를 풀어야 하므로 계산 성능이 엄청나게 소모된다. 최근에는 강화학습(RL)이 MPC의 역할을 대신하거나, 반대로 RL이 갈 방향을 MPC가 제약 조건으로 가이드해주는 하이브리드 제어(Learning-based MPC)가 로보틱스의 새로운 표준이 되고 있다.

🔗 지식 연결 (Graph)

Related: Control-Theory , Decision Theory
AI Hybrid: Deep-Reinforcement-Learning-for-Control