feat(knowledge): reach 700 topics milestone with Batch 5.10

This commit is contained in:
2026-04-20 19:23:15 +09:00
parent ae1627c35b
commit c6057db70f
102 changed files with 2694 additions and 367 deletions
@@ -1,35 +1,33 @@
---
id: P-REINFORCE-AUTO-CSPR-001
id: P-REINFORCE-AUTO-CSP-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.94
tags: [auto-reinforced, csp, algorithms, optimization, constraint-satisfaction, logic]
confidence_score: 0.96
tags: [auto-reinforced, constraint-satisfaction, csp, backtracking, search-algorithm, logic, optimization]
last_reinforced: 2026-04-20
---
# [[Constraint-Satisfaction-Problems]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "조건의 감옥에서 정답 찾기: 수많은 변수와 이들이 지켜야 할 엄격한 제약 조건(Constraints)이 주어졌을 때, 단 하나의 조건이라도 어기지 않으면서 모든 변수에 값을 할당해내는 고도의 논리 연산 과정."
> "한계 내에서의 최적: '이 조건은 만족해야 하고 저 조건은 피해야 한다'는 수많은 제약 사항을 모두 충족하는 단 하나의 정답(또는 최적해)을 찾아내는 수학적 수수께끼 풀이 엔진."
## 📖 구조화된 지식 (Synthesized Content)
제약 충족 문제(CSP)는 일련의 제약 조건을 만족하는 상태나 값을 찾는 수학적 문제입니다.
제약 충족 문제(Constraint-Satisfaction-Problems, CSP)는 변수 세트의 값이 일련의 제약 조건을 만족해야 하는 수학적 문제입니다.
1. **3요소**:
* **Variables ($X$)**: 값을 할당받을 변수들.
* **Domains ($D$)**: 각 변수가 가질 수 있는 값의 범위.
* **Constraints ($C$)**: 변수들 사이의 관계를 제한하는 규칙. (예: "A와 B는 같은 값을 가질 수 없다")
2. **주요 알고리즘**:
* **Backtracking Search**: 값을 하나씩 넣어보다 조건 어기면 뒤로 돌아가.
* **Constraint Propagation**: 미리 불가능한 값들을 지워나가기 (AC-3 등).
* **Local Search**: 대략적으로 채운 뒤 조금씩 고쳐나가기.
3. **대표 사례**:
* 스도쿠, 시간표 짜기(Scheduling), 지도 색칠하기, 회로 설계.
1. **3대 구성 요소**:
* **Variables (V)**: 값을 할당받아야 하는 대상.
* **Domains (D)**: 각 변수가 가질 수 있는 값의 범위.
* **Constraints (C)**: 변수 간에 지켜야 할 규칙 (예: 같은 색은 이웃할 수 없음).
2. **핵심 알고리즘**:
* **Backtracking Search**: 값을 하나씩 넣어보다 제약에 걸리면 뒤로 돌아가 다른 시도.
* **Constraint Propagation (AC-3)**: 미리 불가능한 후보군을 잘라내는 기술. (Efficiency와 연결)
* **Heuristics**: MRV(최소 잔여 값), Degree Heuristic 등을 통해 탐색 속도 극대화. (Search-Strategy와 연결)
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 오직 '논리 연산 정책'으로만 풀려 했으나, 현대 정책은 딥러닝과 강화학습이 결합된 '뉴럴 CSP 솔버 정책'을 통해 훨씬 거대하고 복잡한 조합 최적화 정책을 결함(RL Update). (Combinatorial-Optimization과 밀접)
- **정책 변화(RL Update)**: 윤리적 AI 설계 정책에서, 모델의 답변이 반드시 지켜야 할 법적/도덕적 경계를 'Hard Constraints 정책'으로 설정하고 이를 위반하지 않는 답변만 생성하도록 강제하는 아키텍처 설계에 응용됨.
- **과거 데이터와의 충돌**: 과거에는 단순히 '답을 찾느냐 마느냐'의 정책(Satisfiability)에 집중했으나, 현대 정책은 제약을 부분적으로 위반하더라도 최상의 결과를 내는 '연성 제약 정책(Soft Constraints)'과 최적화 정책을 결함(RL Update).
- **정책 변화(RL Update)**: 최근의 AI 스케줄링 정책이나 칩 설계 정책(EDA) 등은 수조 개의 변수와 제약 정책이 얽힌 거대 CSP 문제로 진화했으며, 이를 AI 가 강화학습 정책으로 해결하려는 시나리오가 주류임.
## 🔗 지식 연결 (Graph)
- [[Combinatorial-Optimization]], [[Search-Optimization]], [[Analysis]], [[Logic]], [[Complexity Theory]]
- **Modern Tech/Tools**: Prolog, MiniZinc, Gecode, Google OR-Tools.
- [[Efficiency]], [[Search-Strategy]], [[Logic]], [[Complexity-Theory]], [[Optimization]]
- **Key Examples**: Map coloring, Sudoku, Scheduling, Protein folding.
---