feat: achieve 600 files milestone in AI knowledge base
This commit is contained in:
@@ -1,28 +1,32 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-COMBO-OPT
|
||||
id: P-REINFORCE-AUTO-COOP-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 0.99
|
||||
tags: [Optimization, Combinatorial, NP-Hard, Algorithm]
|
||||
confidence_score: 0.94
|
||||
tags: [auto-reinforced, combinatorial-optimization, algorithms, complexity, search, heuristic]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Combinatorial-Optimization]] (조합 최적화)
|
||||
# [[Combinatorial-Optimization]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> 무한에 가까운 선택지 속에서 '가장 싸거나', '가장 빠르거나', '가장 효율적인' 단 하나의 조합을 찾아내는 공학의 극한이다.
|
||||
> "최적의 조합 찾기 게임: 셀 수 없이 많은 이산적인 선택지 중에서 특정 목적(품질 최대화, 비용 최소화 등)을 가장 잘 만족시키는 하나의 조합을 찾아내는, 수학과 알고리즘이 결합된 궁극의 퍼즐 풀이."
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **NP-Hard Problems**:
|
||||
- **외판원 문제 (TSP)**: 모든 도시를 한 번씩 방문하고 돌아오는 최단 경로 찾기.
|
||||
- **배낭 문제 (Knapsack)**: 무게 제한 내에 가치가 최대가 되도록 짐 싸기.
|
||||
- **Heuristics & Meta-heuristics**:
|
||||
- 최적해를 찾는 것이 불가능에 가까울 때, '적당히 좋은 해'를 빠르게 찾는 기법. (예: 유전 알고리즘, 담금질 기법(Simulated Annealing)).
|
||||
- **Integer Programming**:
|
||||
- 변수가 정수여야 하는 제약 조건 하에서 최적의 해를 구하는 수학적 기법. 물류 최적화, 스케줄링 등에 필수적이다.
|
||||
조합 최적화(Combinatorial-Optimization)은 주어진 유한한 대상들의 집합에서 최적의 해를 찾는 과정입니다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
- 최근에는 강화학습 에이전트가 조합 최적화 문제를 스스로 학습하여 푸는 연구가 활발하다. 특히 칩 설계(Chip Layout)나 데이터 센터 에너지 최적화 등에서 AI가 인간 설계자를 뛰어넘는 성과를 내고 있다.
|
||||
1. **주요 문제들**:
|
||||
* **Traveling Salesman Problem (TSP)**: 모든 도시를 한 번씩 방문하고 돌아오는 최단 경로 찾기. (Search-Optimization과 연결)
|
||||
* **Knapsack Problem**: 가방 무게 제한 내에서 가치가 최대가 되도록 물건 담기.
|
||||
* **Scheduling**: 여러 작업을 한정된 자원에 가장 효율적으로 배분하기. (Bottlenecks와 연결)
|
||||
2. **해결 기법**:
|
||||
* **Exact Methods**: Brute-force(소규모), Dynamic Programming.
|
||||
* **Heuristics/Metaheuristics**: Genetic Algorithms, Simulated Annealing (적당히 좋은 해를 빠르게 찾기).
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌**: 과거에는 전산 자원의 한계로 인해 '포기하거나 아주 단순한 근사치만 구하는 정책'이 많았으나, 현대 정책은 양자 컴퓨팅이나 딥러닝 기반 '뉴럴 솔버 정책'을 통해 난공불락의 조합 문제를 정복하는 정책으로 도약함(RL Update).
|
||||
- **정책 변화(RL Update)**: 물류와 반도체 설계 정책을 넘어, 'AI 모델 가중치 조합 최적화 정책'과 '프롬프트 자동 조합 정책' 등 지능 시스템 내의 자원 할당 정책에 핵심적으로 사용됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: [[Distributed-Systems-Engineering]] , [[Reinforcement Learning]]
|
||||
- Foundation: [[Computational Thinking]]
|
||||
- [[Brute-force]], [[Optimization]], [[Search-Optimization]], [[Bottlenecks]], [[Genetic-Algorithms]]
|
||||
- **Modern Tech/Tools**: Gurobi, CPLEX, Google OR-Tools, Metaheuristic frameworks.
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user