docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, alignment, ai-safety, value-alignment, rlhf, future-of-a
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Alignment]]
|
||||
# [[Alignment|Alignment]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "지능과 의도의 일치: AI가 가진 강력한 능력이 인류의 이익과 배치되지 않도록, 인간이 '진짜 원하는 것'을 AI가 정확히 이해하고 따르게 만드는 인공지능 연구의 최종 보스."
|
||||
@@ -28,6 +28,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: 누가 정한 '인간의 가치'를 따를 것인가에 대한 논쟁 정책이 격화됨에 따라, 특정 국가의 가치가 아닌 보편적 인권과 다양성을 보장하는 '다원적 정렬 정책' 수립이 국제 사회의 과제가 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[AI Safety]], [[AI Governance]], [[RLHF (인간 피드백 기반 강화 학습)]], [[Actor-Critic-Models]], [[Ethics & AI]]
|
||||
- [[AI Safety|AI Safety]], [[AI Governance|AI Governance]], [[RLHF (인간 피드백 기반 강화 학습)|RLHF (인간 피드백 기반 강화 학습)]], [[Actor-Critic-Models|Actor-Critic-Models]], [[Ethics & AI|Ethics & AI]]
|
||||
- **Modern Tech/Tools**: OpenAI Alignment team research, Anthropic's Constitutional AI, Superalignment.
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user