36 lines
2.3 KiB
Markdown
36 lines
2.3 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-CSPR-001
|
|
category: "[[10_Wiki/💡 Topics/AI]]"
|
|
confidence_score: 0.94
|
|
tags: [auto-reinforced, csp, algorithms, optimization, constraint-satisfaction, logic]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Constraint-Satisfaction-Problems]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "조건의 감옥에서 정답 찾기: 수많은 변수와 이들이 지켜야 할 엄격한 제약 조건(Constraints)이 주어졌을 때, 단 하나의 조건이라도 어기지 않으면서 모든 변수에 값을 할당해내는 고도의 논리 연산 과정."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
제약 충족 문제(CSP)는 일련의 제약 조건을 만족하는 상태나 값을 찾는 수학적 문제입니다.
|
|
|
|
1. **3요소**:
|
|
* **Variables ($X$)**: 값을 할당받을 변수들.
|
|
* **Domains ($D$)**: 각 변수가 가질 수 있는 값의 범위.
|
|
* **Constraints ($C$)**: 변수들 사이의 관계를 제한하는 규칙. (예: "A와 B는 같은 값을 가질 수 없다")
|
|
2. **주요 알고리즘**:
|
|
* **Backtracking Search**: 값을 하나씩 넣어보다 조건 어기면 뒤로 돌아가기.
|
|
* **Constraint Propagation**: 미리 불가능한 값들을 지워나가기 (AC-3 등).
|
|
* **Local Search**: 대략적으로 채운 뒤 조금씩 고쳐나가기.
|
|
3. **대표 사례**:
|
|
* 스도쿠, 시간표 짜기(Scheduling), 지도 색칠하기, 회로 설계.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 오직 '논리 연산 정책'으로만 풀려 했으나, 현대 정책은 딥러닝과 강화학습이 결합된 '뉴럴 CSP 솔버 정책'을 통해 훨씬 거대하고 복잡한 조합 최적화 정책을 해결함(RL Update). (Combinatorial-Optimization과 밀접)
|
|
- **정책 변화(RL Update)**: 윤리적 AI 설계 정책에서, 모델의 답변이 반드시 지켜야 할 법적/도덕적 경계를 'Hard Constraints 정책'으로 설정하고 이를 위반하지 않는 답변만 생성하도록 강제하는 아키텍처 설계에 응용됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Combinatorial-Optimization]], [[Search-Optimization]], [[Analysis]], [[Logic]], [[Complexity Theory]]
|
|
- **Modern Tech/Tools**: Prolog, MiniZinc, Gecode, Google OR-Tools.
|
|
---
|