docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

This commit is contained in:
Antigravity Agent
2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
@@ -6,7 +6,7 @@ tags: [auto-reinforced, constitutional-ai, ai-safety, ethics, rlaif, anthropic]
last_reinforced: 2026-04-20
---
# [[Constitutional AI (헌법 AI)]]
# [[Constitutional AI (헌법 AI)|Constitutional AI (헌법 AI)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "AI에게 헌법을 주다: 모델의 행동을 일일이 사람이 교정하는 대신, 지켜야 할 명확한 원칙(헌법)을 입력하고 AI가 스스로 그 원칙에 따라 자신의 답변을 평가하고 수정하게 만드는 고차원적 자가 정렬 기법."
@@ -25,6 +25,6 @@ last_reinforced: 2026-04-20
- **정책 변화(RL Update)**: 어떤 가치가 헌법에 포함되어야 하는가에 대한 '민주적 헌법 제정 정책'이 중요해짐에 따라, 기술 기업이 독점하는 가치가 아닌 인류 보편적 가치 정책을 반영하려는 사회적 합의 활동이 활발해짐.
## 🔗 지식 연결 (Graph)
- [[RLHF (인간 피드백 기반 강화 학습)]], [[AI Safety]], [[Ethics & AI]], [[Alignment]], [[Policy-Surveillance]]
- [[RLHF (인간 피드백 기반 강화 학습)|RLHF (인간 피드백 기반 강화 학습)]], [[AI Safety|AI Safety]], [[Ethics & AI|Ethics & AI]], [[Alignment|Alignment]], [[Policy-Surveillance|Policy-Surveillance]]
- **Modern Tech/Tools**: Claude (Anthropic), RLAIF frameworks, Constitutional drafting guides.
---