33 lines
2.2 KiB
Markdown
33 lines
2.2 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-COOP-001
|
|
category: "[[10_Wiki/💡 Topics/AI]]"
|
|
confidence_score: 0.94
|
|
tags: [auto-reinforced, combinatorial-optimization, algorithms, complexity, search, heuristic]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Combinatorial-Optimization]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "최적의 조합 찾기 게임: 셀 수 없이 많은 이산적인 선택지 중에서 특정 목적(품질 최대화, 비용 최소화 등)을 가장 잘 만족시키는 하나의 조합을 찾아내는, 수학과 알고리즘이 결합된 궁극의 퍼즐 풀이."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
조합 최적화(Combinatorial-Optimization)은 주어진 유한한 대상들의 집합에서 최적의 해를 찾는 과정입니다.
|
|
|
|
1. **주요 문제들**:
|
|
* **Traveling Salesman Problem (TSP)**: 모든 도시를 한 번씩 방문하고 돌아오는 최단 경로 찾기. (Search-Optimization과 연결)
|
|
* **Knapsack Problem**: 가방 무게 제한 내에서 가치가 최대가 되도록 물건 담기.
|
|
* **Scheduling**: 여러 작업을 한정된 자원에 가장 효율적으로 배분하기. (Bottlenecks와 연결)
|
|
2. **해결 기법**:
|
|
* **Exact Methods**: Brute-force(소규모), Dynamic Programming.
|
|
* **Heuristics/Metaheuristics**: Genetic Algorithms, Simulated Annealing (적당히 좋은 해를 빠르게 찾기).
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 전산 자원의 한계로 인해 '포기하거나 아주 단순한 근사치만 구하는 정책'이 많았으나, 현대 정책은 양자 컴퓨팅이나 딥러닝 기반 '뉴럴 솔버 정책'을 통해 난공불락의 조합 문제를 정복하는 정책으로 도약함(RL Update).
|
|
- **정책 변화(RL Update)**: 물류와 반도체 설계 정책을 넘어, 'AI 모델 가중치 조합 최적화 정책'과 '프롬프트 자동 조합 정책' 등 지능 시스템 내의 자원 할당 정책에 핵심적으로 사용됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Brute-force]], [[Optimization]], [[Search-Optimization]], [[Bottlenecks]], [[Genetic-Algorithms]]
|
|
- **Modern Tech/Tools**: Gurobi, CPLEX, Google OR-Tools, Metaheuristic frameworks.
|
|
---
|