2.5 KiB
2.5 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| MATH-OPT-CTRL-001 | 10_Wiki/💡 Topics/AI | 1.0 |
|
2026-04-26 |
Optimal Control Theory (최적 제어 이론)
📌 한 줄 통찰 (The Karpathy Summary)
"한정된 에너지를 가장 영리하게 사용하여, 시스템이 목표한 궤도에 가장 우아하게 도달하게 하라" — 시간에 따라 변화하는 동적 시스템의 거동을 제어하여, 특정 목적 함수(Cost Function)를 최소화하거나 이득을 최대화하는 최적의 제어 법칙을 찾아내는 수학적 이론.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: "Trajectory Optimization and Dynamic Programming" — 시스템의 현재 상태와 물리적 제약 조건을 고려하여 미래의 일련의 행동들을 계획하고, 벨만 방정식(Bellman Equation)이나 폰트랴긴의 최대 원리를 통해 최선의 경로를 산출하는 제어 패턴.
- 핵심 개념:
- LQR (Linear Quadratic Regulator): 선형 시스템에서 오차의 제곱합을 최소화하는 표준 제어 기법.
- MPC (Model Predictive Control): 미래의 일정 구간을 예측하여 매 순간 최적의 입력을 다시 계산하는 실시간 제어 방식.
- Hamiltonian: 시스템의 에너지 보존과 변화율을 다루는 핵심 물리 수식.
- 의의: 강화학습(RL)의 근간이 되는 이론적 토대이며, 자율주행, 항공우주, 드론 제어 등 물리적 실체가 있는 AI 시스템의 필수 학문.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 모든 물리 수식을 완벽히 알아야 했던 과거의 모델 기반 제어(Model-based)에서, 이제는 수식을 몰라도 데이터를 통해 제어 규칙을 배우는 강화학습 기반의 데이터 주도 제어(Data-driven)와 결합하여 적응력이 극대화됨.
- 정책 변화: Skybound 프로젝트의 미사일 궤적 최적화 및 에이전트의 자원 배분 시나리오 설계 시, 최적 제어 이론의 비용 함수 설계 원칙을 준수하여 시스템의 안정성을 확보함.
🔗 지식 연결 (Graph)
- Reinforcement-Learning, Monte-Carlo-Tree-Search-MCTS, Markov-Decision-Process-MDP, Fluid-Dynamics
- Raw Source: 10_Wiki/Topics/AI/Optimal-Control-Theory.md