Files
2nd/10_Wiki/Topics/AI/Constraint-Satisfaction-Problems.md
T

2.3 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AUTO-CSPR-001 10_Wiki/💡 Topics/AI 0.94
auto-reinforced
csp
algorithms
optimization
constraint-satisfaction
logic
2026-04-20

Constraint-Satisfaction-Problems

📌 한 줄 통찰 (The Karpathy Summary)

"조건의 감옥에서 정답 찾기: 수많은 변수와 이들이 지켜야 할 엄격한 제약 조건(Constraints)이 주어졌을 때, 단 하나의 조건이라도 어기지 않으면서 모든 변수에 값을 할당해내는 고도의 논리 연산 과정."

📖 구조화된 지식 (Synthesized Content)

제약 충족 문제(CSP)는 일련의 제약 조건을 만족하는 상태나 값을 찾는 수학적 문제입니다.

  1. 3요소:
    • Variables (X): 값을 할당받을 변수들.
    • Domains (D): 각 변수가 가질 수 있는 값의 범위.
    • Constraints (C): 변수들 사이의 관계를 제한하는 규칙. (예: "A와 B는 같은 값을 가질 수 없다")
  2. 주요 알고리즘:
    • Backtracking Search: 값을 하나씩 넣어보다 조건 어기면 뒤로 돌아가기.
    • Constraint Propagation: 미리 불가능한 값들을 지워나가기 (AC-3 등).
    • Local Search: 대략적으로 채운 뒤 조금씩 고쳐나가기.
  3. 대표 사례:
    • 스도쿠, 시간표 짜기(Scheduling), 지도 색칠하기, 회로 설계.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 오직 '논리 연산 정책'으로만 풀려 했으나, 현대 정책은 딥러닝과 강화학습이 결합된 '뉴럴 CSP 솔버 정책'을 통해 훨씬 거대하고 복잡한 조합 최적화 정책을 해결함(RL Update). (Combinatorial-Optimization과 밀접)
  • 정책 변화(RL Update): 윤리적 AI 설계 정책에서, 모델의 답변이 반드시 지켜야 할 법적/도덕적 경계를 'Hard Constraints 정책'으로 설정하고 이를 위반하지 않는 답변만 생성하도록 강제하는 아키텍처 설계에 응용됨.

🔗 지식 연결 (Graph)