docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, ai-ethics, toxicity-mitigation, bias-reduction, safety-b
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Toxicity-and-Bias-Mitigation]]
|
||||
# [[Toxicity-and-Bias-Mitigation|Toxicity-and-Bias-Mitigation]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "독성 제거와 공정함의 수호: 학습 데이터에 숨겨진 인간의 편견과 혐오가 AI를 통해 증폭되지 않도록, 필터링과 교정 알고리즘을 통해 깨끗하고 공정한 지능을 빚어내는 윤리적 공정."
|
||||
@@ -29,6 +29,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: '완전한 중립'이라는 허상을 쫓기보다, 해당 사회의 보편적 윤리 기준을 명시적으로 시스템에 이식하고 그 기준의 수립 과정을 투명하게 공개하는 '가치 정렬(Value Alignment) 거버넌스 정책'이 글로벌 표준이 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Ethics & AI]], Generative-AI-Safety, [[RLHF (인간 피드백 기반 강화 학습)]], [[Social Systems Theory]], [[Science of Failure]]
|
||||
- [[Ethics & AI|Ethics & AI]], Generative-AI-Safety, [[RLHF (인간 피드백 기반 강화 학습)|RLHF (인간 피드백 기반 강화 학습)]], [[Social Systems Theory|Social Systems Theory]], [[Science of Failure|Science of Failure]]
|
||||
- **Modern Tech/Tools**: Perspective API, OpenAI Moderation API, Constitutional AI (Anthropic).
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user