29 lines
2.5 KiB
Markdown
29 lines
2.5 KiB
Markdown
---
|
|
id: MATH-OPT-CTRL-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 1.0
|
|
tags: [math, control-theory, optimal-control, bellman-equation, reinforcement-learning, robotics]
|
|
last_reinforced: 2026-04-26
|
|
---
|
|
|
|
# Optimal Control Theory (최적 제어 이론)
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "한정된 에너지를 가장 영리하게 사용하여, 시스템이 목표한 궤도에 가장 우아하게 도달하게 하라" — 시간에 따라 변화하는 동적 시스템의 거동을 제어하여, 특정 목적 함수(Cost Function)를 최소화하거나 이득을 최대화하는 최적의 제어 법칙을 찾아내는 수학적 이론.
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
- **추출된 패턴:** "Trajectory Optimization and Dynamic Programming" — 시스템의 현재 상태와 물리적 제약 조건을 고려하여 미래의 일련의 행동들을 계획하고, 벨만 방정식(Bellman Equation)이나 폰트랴긴의 최대 원리를 통해 최선의 경로를 산출하는 제어 패턴.
|
|
- **핵심 개념:**
|
|
- **LQR (Linear Quadratic Regulator):** 선형 시스템에서 오차의 제곱합을 최소화하는 표준 제어 기법.
|
|
- **MPC (Model Predictive Control):** 미래의 일정 구간을 예측하여 매 순간 최적의 입력을 다시 계산하는 실시간 제어 방식.
|
|
- **Hamiltonian:** 시스템의 에너지 보존과 변화율을 다루는 핵심 물리 수식.
|
|
- **의의:** 강화학습(RL)의 근간이 되는 이론적 토대이며, 자율주행, 항공우주, 드론 제어 등 물리적 실체가 있는 AI 시스템의 필수 학문.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌:** 모든 물리 수식을 완벽히 알아야 했던 과거의 모델 기반 제어(Model-based)에서, 이제는 수식을 몰라도 데이터를 통해 제어 규칙을 배우는 강화학습 기반의 데이터 주도 제어(Data-driven)와 결합하여 적응력이 극대화됨.
|
|
- **정책 변화:** Skybound 프로젝트의 미사일 궤적 최적화 및 에이전트의 자원 배분 시나리오 설계 시, 최적 제어 이론의 비용 함수 설계 원칙을 준수하여 시스템의 안정성을 확보함.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Reinforcement-Learning|Reinforcement-Learning]], [[Monte-Carlo-Tree-Search-MCTS|Monte-Carlo-Tree-Search-MCTS]], [[Markov-Decision-Process-MDP|Markov-Decision-Process-MDP]], Fluid-Dynamics
|
|
- **Raw Source:** 10_Wiki/Topics/AI/Optimal-Control-Theory.md
|