33 lines
2.5 KiB
Markdown
33 lines
2.5 KiB
Markdown
---
|
|
id: [[P-Reinforce|P-Reinforce]]-AUTO-ETAI-001
|
|
category: Dev
|
|
confidence_score: 0.98
|
|
tags: [auto-reinforced, ethics, ai-ethics, [[Alignment|Alignment]], safety, responsibility, bias]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Ethics & AI|Ethics & AI]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "기계의 도덕적 나침반: 지능을 가진 기계가 인간을 해치지 않고 보편적 가치에 부합하도록 설계되었는가?라는 질문에 답하기 위해, 알고리즘 이면의 책임성, 투명성, 공정성을 끊임없이 감시하고 정렬하는 AI 시대의 규범적 기둥."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
AI 윤리(Ethics & AI)는 AI 시스템의 개발과 사용에서 발생하는 도덕적 문제를 연구하는 학문입니다.
|
|
|
|
1. **핵심 원칙 (UNESCO/OECD 기준)**:
|
|
* **Transparency (투명성)**: AI가 왜 그런 결정을 내렸는지 설명 가능해야 함. (XAI와 연결)
|
|
* **Fairness (공정성)**: 특정 집단에 비우호적인 결과가 나오지 않도록 관리. ([[Equality|Equality]]와 연결)
|
|
* **Safety & Security**: 해킹이나 오작동으로 인한 물리적/정신적 피해 방지. ([[AI Safety|AI Safety]]와 연결)
|
|
* **Responsibility (책임성)**: 사고 발생 시 누가 책임을 지는가에 대한 법적/윤리적 주체 명확화.
|
|
2. **왜 중요한가?**:
|
|
* 기술이 통제를 벗어나 인간의 존엄성을 위협하는 것을 막고, 지속 가능한 인공지능 발전을 위한 사회적 합의의 기초가 됨.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 성능만 좋으면 장땡이라는 '기술 만능주의 정책'이 우세했으나, 현대 정책은 윤리적 정렬(Alignment) 없이는 서비스 출시 자체가 불가능한 '윤리 우선 배포 정책'으로 완전히 전환됨(RL Update). (Constitutional AI와 연결)
|
|
- **정책 변화(RL Update)**: 단순히 '나쁜 말 하지 않기' 수준을 넘어, 기계가 인간의 '미묘한 의도(Nuance)'와 '맥락적 공감'을 통해 최선의 선을 행하도록 하는 '강력한 정렬 정책' 개발이 핵심 경쟁력이 됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Constitutional AI (헌법 AI)|Constitutional AI (헌법 AI)]], [[AI Safety|AI Safety]], [[Equality|Equality]], [[Epistemology|Epistemology]], [[Empathy-in-AI|Empathy-in-AI]]
|
|
- **Modern Tech/Tools**: Red-teaming, Bias auditing tools, Ethics impact [[Assessment|Assessment]]s (EIA).
|
|
---
|