feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup
This commit is contained in:
@@ -1,12 +1,12 @@
|
||||
---
|
||||
id: CONST-AI-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [ai-safety, constitutional-ai, rlaif, alignment, ethics]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Constitutional AI (헌법적 AI)]]
|
||||
# Constitutional AI (헌법적 AI)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "인간의 피드백 대신, AI에게 명문화된 헌법을 가르쳐 스스로 정렬하게 하라" — Anthropic이 제안한 방식으로, AI 모델에게 일련의 원칙(헌법)을 제공하고, 모델이 자신의 답변을 이 원칙에 따라 스스로 비판하고 수정하도록 학습시키는 정렬 기법.
|
||||
@@ -23,5 +23,5 @@ last_reinforced: 2026-04-26
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 행동 규범을 정의할 때 '헌법적 AI' 방법론을 차용하여, 에이전트가 지켜야 할 핵심 가치(구체성, 성실성, 안전성)를 명문화하고 이를 기반으로 답변을 자가 검증함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[AI-Alignment]], [[Reinforcement-Learning-from-Human-Feedback-RLHF]], [[Trustworthy-AI]], [[AI-Safety]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Constitutional-AI.md]]
|
||||
- [[AI-Alignment]], [[Reinforcement-Learning-from-Human-Feedback-RLHF]], [[Trustworthy-AI]], AI-Safety
|
||||
- **Raw Source:** 10_Wiki/Topics/AI/Constitutional-AI.md
|
||||
|
||||
Reference in New Issue
Block a user