32 lines
2.2 KiB
Markdown
32 lines
2.2 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-LIPR-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.95
|
|
tags: [auto-reinforced, linear-programming, optimization, algorithms, operations-research, constraints]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Linear-Programming|Linear-Programming]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "현실적인 최선의 타협: '예산'은 얼마고 '시간'은 부족하다는 수많은 제약 조건 속에서, 이익을 최대화하거나 비용을 최소화하는 황금 해답을 선형 방정식이라는 수식을 통해 찾아내는 최적화의 정석."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
선형 계획법(Linear-Programming, LP)은 제약 조건이 있는 상황에서 선형 함수의 최댓값이나 최솟값을 구하는 수학적 방법입니다.
|
|
|
|
1. **3대 요소**:
|
|
* **Objective Function**: 우리가 극대화하려는 것 (예: 수익).
|
|
* **Decision Variables**: 우리가 조정할 수 있는 값 (예: 생산량).
|
|
* **Constraints**: 우리가 넘어서는 안 될 벽 (예: 예산, 자원 부족).
|
|
2. **활용 분야**:
|
|
* 비행기 좌석 노선 배치, 공장 생산 스케줄링, 영양 균형 식단 짜기 등. (Combinatorial-Optimization와 연결)
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 변수가 몇 개 없는 단순 계산 정책이었으나, 현대 정책은 캄마르카르 알고리즘 정책 등을 활용해 수백만 개의 변수를 가진 전 지구적 물류망 정책 등을 최적화하는 단계로 진입함(RL Update).
|
|
- **정책 변화(RL Update)**: 단순 LP 정책을 넘어, 변수가 정수여야 하거나(Integer Programming) 관계가 비선형인 경우까지 아우르는 '현대적 운영 과학(OR) 정책'으로 진화하며 AI의 결정 보조 도구 정책으로 강력하게 작동함.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Optimization|Optimization]], [[Combinatorial-Optimization|Combinatorial-Optimization]], [[Search-Optimization|Search-Optimization]], [[Decision Theory|Decision Theory]], [[Efficiency|Efficiency]]
|
|
- **Modern Tech/Tools**: Simplex algorithm, Gurobi, IBM CPLEX, Microsoft Excel Solver.
|
|
---
|