29 lines
1.6 KiB
Markdown
29 lines
1.6 KiB
Markdown
---
|
|
id: P-REINFORCE-AI-COMBO-OPT
|
|
category: "[[10_Wiki/💡 Topics/AI]]"
|
|
confidence_score: 0.99
|
|
tags: [Optimization, Combinatorial, NP-Hard, Algorithm]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Combinatorial-Optimization]] (조합 최적화)
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> 무한에 가까운 선택지 속에서 '가장 싸거나', '가장 빠르거나', '가장 효율적인' 단 하나의 조합을 찾아내는 공학의 극한이다.
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
- **NP-Hard Problems**:
|
|
- **외판원 문제 (TSP)**: 모든 도시를 한 번씩 방문하고 돌아오는 최단 경로 찾기.
|
|
- **배낭 문제 (Knapsack)**: 무게 제한 내에 가치가 최대가 되도록 짐 싸기.
|
|
- **Heuristics & Meta-heuristics**:
|
|
- 최적해를 찾는 것이 불가능에 가까울 때, '적당히 좋은 해'를 빠르게 찾는 기법. (예: 유전 알고리즘, 담금질 기법(Simulated Annealing)).
|
|
- **Integer Programming**:
|
|
- 변수가 정수여야 하는 제약 조건 하에서 최적의 해를 구하는 수학적 기법. 물류 최적화, 스케줄링 등에 필수적이다.
|
|
|
|
## ⚠️ 모순 및 업데이트 (RL Update)
|
|
- 최근에는 강화학습 에이전트가 조합 최적화 문제를 스스로 학습하여 푸는 연구가 활발하다. 특히 칩 설계(Chip Layout)나 데이터 센터 에너지 최적화 등에서 AI가 인간 설계자를 뛰어넘는 성과를 내고 있다.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- Related: [[Distributed-Systems-Engineering]] , [[Reinforcement Learning]]
|
|
- Foundation: [[Computational Thinking]]
|