feat: achieve 600 files milestone in AI knowledge base

2026-04-20 19:10:32 +09:00
parent ed5140096e
commit ae1627c35b
713 changed files with 21197 additions and 1994 deletions
@@ -1,28 +1,32 @@
 ---
-id: P-REINFORCE-AI-COMBO-OPT
+id: P-REINFORCE-AUTO-COOP-001
 category: "[[10_Wiki/💡 Topics/AI]]"
-confidence_score: 0.99
-tags: [Optimization, Combinatorial, NP-Hard, Algorithm]
+confidence_score: 0.94
+tags: [auto-reinforced, combinatorial-optimization, algorithms, complexity, search, heuristic]
 last_reinforced: 2026-04-20
 ---

-# [[Combinatorial-Optimization]] (조합 최적화)
+# [[Combinatorial-Optimization]]

 ## 📌 한 줄 통찰 (The Karpathy Summary)
-> 무한에 가까운 선택지 속에서 '가장 싸거나', '가장 빠르거나', '가장 효율적인' 단 하나의 조합을 찾아내는 공학의 극한이다.
+> "최적의 조합 찾기 게임: 셀 수 없이 많은 이산적인 선택지 중에서 특정 목적(품질 최대화, 비용 최소화 등)을 가장 잘 만족시키는 하나의 조합을 찾아내는, 수학과 알고리즘이 결합된 궁극의 퍼즐 풀이."

 ## 📖 구조화된 지식 (Synthesized Content)
- **NP-Hard Problems**:
-    - **외판원 문제 (TSP)**: 모든 도시를 한 번씩 방문하고 돌아오는 최단 경로 찾기.
-    - **배낭 문제 (Knapsack)**: 무게 제한 내에 가치가 최대가 되도록 짐 싸기.
- **Heuristics & Meta-heuristics**:
-    - 최적해를 찾는 것이 불가능에 가까울 때, '적당히 좋은 해'를 빠르게 찾는 기법. (예: 유전 알고리즘, 담금질 기법(Simulated Annealing)).
- **Integer Programming**:
-    - 변수가 정수여야 하는 제약 조건 하에서 최적의 해를 구하는 수학적 기법. 물류 최적화, 스케줄링 등에 필수적이다.
+조합 최적화(Combinatorial-Optimization)은 주어진 유한한 대상들의 집합에서 최적의 해를 찾는 과정입니다.

-## ⚠️ 모순 및 업데이트 (RL Update)
- 최근에는 강화학습 에이전트가 조합 최적화 문제를 스스로 학습하여 푸는 연구가 활발하다. 특히 칩 설계(Chip Layout)나 데이터 센터 에너지 최적화 등에서 AI가 인간 설계자를 뛰어넘는 성과를 내고 있다.
+1.  **주요 문제들**:
+    *   **Traveling Salesman Problem (TSP)**: 모든 도시를 한 번씩 방문하고 돌아오는 최단 경로 찾기. (Search-Optimization과 연결)
+    *   **Knapsack Problem**: 가방 무게 제한 내에서 가치가 최대가 되도록 물건 담기.
+    *   **Scheduling**: 여러 작업을 한정된 자원에 가장 효율적으로 배분하기. (Bottlenecks와 연결)
+2.  **해결 기법**:
+    *   **Exact Methods**: Brute-force(소규모), Dynamic Programming.
+    *   **Heuristics/Metaheuristics**: Genetic Algorithms, Simulated Annealing (적당히 좋은 해를 빠르게 찾기).
+
+## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
+- **과거 데이터와의 충돌**: 과거에는 전산 자원의 한계로 인해 '포기하거나 아주 단순한 근사치만 구하는 정책'이 많았으나, 현대 정책은 양자 컴퓨팅이나 딥러닝 기반 '뉴럴 솔버 정책'을 통해 난공불락의 조합 문제를 정복하는 정책으로 도약함(RL Update).
+- **정책 변화(RL Update)**: 물류와 반도체 설계 정책을 넘어, 'AI 모델 가중치 조합 최적화 정책'과 '프롬프트 자동 조합 정책' 등 지능 시스템 내의 자원 할당 정책에 핵심적으로 사용됨.

 ## 🔗 지식 연결 (Graph)
- Related: [[Distributed-Systems-Engineering]] , [[Reinforcement Learning]]
- Foundation: [[Computational Thinking]]
+- [[Brute-force]], [[Optimization]], [[Search-Optimization]], [[Bottlenecks]], [[Genetic-Algorithms]]
+- **Modern Tech/Tools**: Gurobi, CPLEX, Google OR-Tools, Metaheuristic frameworks.
+---