---
id: P-REINFORCE-AI-COMBO-OPT
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.99
tags: [Optimization, Combinatorial, NP-Hard, Algorithm]
last_reinforced: 2026-04-20
---

# [[Combinatorial-Optimization]] (조합 최적화)

## 📌 한 줄 통찰 (The Karpathy Summary)
> 무한에 가까운 선택지 속에서 '가장 싸거나', '가장 빠르거나', '가장 효율적인' 단 하나의 조합을 찾아내는 공학의 극한이다.

## 📖 구조화된 지식 (Synthesized Content)
- **NP-Hard Problems**:
    - **외판원 문제 (TSP)**: 모든 도시를 한 번씩 방문하고 돌아오는 최단 경로 찾기.
    - **배낭 문제 (Knapsack)**: 무게 제한 내에 가치가 최대가 되도록 짐 싸기.
- **Heuristics & Meta-heuristics**:
    - 최적해를 찾는 것이 불가능에 가까울 때, '적당히 좋은 해'를 빠르게 찾는 기법. (예: 유전 알고리즘, 담금질 기법(Simulated Annealing)).
- **Integer Programming**:
    - 변수가 정수여야 하는 제약 조건 하에서 최적의 해를 구하는 수학적 기법. 물류 최적화, 스케줄링 등에 필수적이다.

## ⚠️ 모순 및 업데이트 (RL Update)
- 최근에는 강화학습 에이전트가 조합 최적화 문제를 스스로 학습하여 푸는 연구가 활발하다. 특히 칩 설계(Chip Layout)나 데이터 센터 에너지 최적화 등에서 AI가 인간 설계자를 뛰어넘는 성과를 내고 있다.

## 🔗 지식 연결 (Graph)
- Related: [[Distributed-Systems-Engineering]] , [[Reinforcement Learning]]
- Foundation: [[Computational Thinking]]