bluemsi/2nd

Files

T

bluemsi ae1627c35b feat: achieve 600 files milestone in AI knowledge base

2026-04-20 19:23:51 +09:00

2.3 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AUTO-CSPR-001

10_Wiki/💡 Topics/AI

0.94

auto-reinforced

csp

algorithms

optimization

constraint-satisfaction

logic

2026-04-20

Constraint-Satisfaction-Problems

📌 한 줄 통찰 (The Karpathy Summary)

"조건의 감옥에서 정답 찾기: 수많은 변수와 이들이 지켜야 할 엄격한 제약 조건(Constraints)이 주어졌을 때, 단 하나의 조건이라도 어기지 않으면서 모든 변수에 값을 할당해내는 고도의 논리 연산 과정."

📖 구조화된 지식 (Synthesized Content)

제약 충족 문제(CSP)는 일련의 제약 조건을 만족하는 상태나 값을 찾는 수학적 문제입니다.

3요소:
- Variables (X): 값을 할당받을 변수들.
- Domains (D): 각 변수가 가질 수 있는 값의 범위.
- Constraints (C): 변수들 사이의 관계를 제한하는 규칙. (예: "A와 B는 같은 값을 가질 수 없다")
주요 알고리즘:
- Backtracking Search: 값을 하나씩 넣어보다 조건 어기면 뒤로 돌아가기.
- Constraint Propagation: 미리 불가능한 값들을 지워나가기 (AC-3 등).
- Local Search: 대략적으로 채운 뒤 조금씩 고쳐나가기.
대표 사례:
- 스도쿠, 시간표 짜기(Scheduling), 지도 색칠하기, 회로 설계.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 과거에는 오직 '논리 연산 정책'으로만 풀려 했으나, 현대 정책은 딥러닝과 강화학습이 결합된 '뉴럴 CSP 솔버 정책'을 통해 훨씬 거대하고 복잡한 조합 최적화 정책을 해결함(RL Update). (Combinatorial-Optimization과 밀접)
정책 변화(RL Update): 윤리적 AI 설계 정책에서, 모델의 답변이 반드시 지켜야 할 법적/도덕적 경계를 'Hard Constraints 정책'으로 설정하고 이를 위반하지 않는 답변만 생성하도록 강제하는 아키텍처 설계에 응용됨.

🔗 지식 연결 (Graph)

Combinatorial-Optimization, Search-Optimization, Analysis, Logic, Complexity Theory
Modern Tech/Tools: Prolog, MiniZinc, Gecode, Google OR-Tools.