2.3 KiB
2.3 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| P-REINFORCE-AUTO-CSPR-001 | 10_Wiki/💡 Topics/AI | 0.94 |
|
2026-04-20 |
Constraint-Satisfaction-Problems
📌 한 줄 통찰 (The Karpathy Summary)
"조건의 감옥에서 정답 찾기: 수많은 변수와 이들이 지켜야 할 엄격한 제약 조건(Constraints)이 주어졌을 때, 단 하나의 조건이라도 어기지 않으면서 모든 변수에 값을 할당해내는 고도의 논리 연산 과정."
📖 구조화된 지식 (Synthesized Content)
제약 충족 문제(CSP)는 일련의 제약 조건을 만족하는 상태나 값을 찾는 수학적 문제입니다.
- 3요소:
- Variables (
X): 값을 할당받을 변수들. - Domains (
D): 각 변수가 가질 수 있는 값의 범위. - Constraints (
C): 변수들 사이의 관계를 제한하는 규칙. (예: "A와 B는 같은 값을 가질 수 없다")
- Variables (
- 주요 알고리즘:
- Backtracking Search: 값을 하나씩 넣어보다 조건 어기면 뒤로 돌아가기.
- Constraint Propagation: 미리 불가능한 값들을 지워나가기 (AC-3 등).
- Local Search: 대략적으로 채운 뒤 조금씩 고쳐나가기.
- 대표 사례:
- 스도쿠, 시간표 짜기(Scheduling), 지도 색칠하기, 회로 설계.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 과거에는 오직 '논리 연산 정책'으로만 풀려 했으나, 현대 정책은 딥러닝과 강화학습이 결합된 '뉴럴 CSP 솔버 정책'을 통해 훨씬 거대하고 복잡한 조합 최적화 정책을 해결함(RL Update). (Combinatorial-Optimization과 밀접)
- 정책 변화(RL Update): 윤리적 AI 설계 정책에서, 모델의 답변이 반드시 지켜야 할 법적/도덕적 경계를 'Hard Constraints 정책'으로 설정하고 이를 위반하지 않는 답변만 생성하도록 강제하는 아키텍처 설계에 응용됨.
🔗 지식 연결 (Graph)
- Combinatorial-Optimization, Search-Optimization, Analysis, Logic, Complexity Theory
- Modern Tech/Tools: Prolog, MiniZinc, Gecode, Google OR-Tools.