Files
2nd/10_Wiki/Topics/AI_and_ML/Ethics & AI.md
T

2.5 KiB


id: P-Reinforce-AUTO-ETAI-001 category: Unified confidence_score: 0.98 tags: [auto-reinforced, ethics, ai-ethics, Alignment, safety, responsibility, bias] last_reinforced: 2026-04-20

Ethics & AI

📌 한 줄 통찰 (The Karpathy Summary)

"기계의 도덕적 나침반: 지능을 가진 기계가 인간을 해치지 않고 보편적 가치에 부합하도록 설계되었는가?라는 질문에 답하기 위해, 알고리즘 이면의 책임성, 투명성, 공정성을 끊임없이 감시하고 정렬하는 AI 시대의 규범적 기둥."

📖 구조화된 지식 (Synthesized Content)

AI 윤리(Ethics & AI)는 AI 시스템의 개발과 사용에서 발생하는 도덕적 문제를 연구하는 학문입니다.

  1. 핵심 원칙 (UNESCO/OECD 기준):
    • Transparency (투명성): AI가 왜 그런 결정을 내렸는지 설명 가능해야 함. (XAI와 연결)
    • Fairness (공정성): 특정 집단에 비우호적인 결과가 나오지 않도록 관리. (Equality와 연결)
    • Safety & Security: 해킹이나 오작동으로 인한 물리적/정신적 피해 방지. (AI Safety와 연결)
    • Responsibility (책임성): 사고 발생 시 누가 책임을 지는가에 대한 법적/윤리적 주체 명확화.
  2. 왜 중요한가?:
    • 기술이 통제를 벗어나 인간의 존엄성을 위협하는 것을 막고, 지속 가능한 인공지능 발전을 위한 사회적 합의의 기초가 됨.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 성능만 좋으면 장땡이라는 '기술 만능주의 정책'이 우세했으나, 현대 정책은 윤리적 정렬(Alignment) 없이는 서비스 출시 자체가 불가능한 '윤리 우선 배포 정책'으로 완전히 전환됨(RL Update). (Constitutional AI와 연결)
  • 정책 변화(RL Update): 단순히 '나쁜 말 하지 않기' 수준을 넘어, 기계가 인간의 '미묘한 의도(Nuance)'와 '맥락적 공감'을 통해 최선의 선을 행하도록 하는 '강력한 정렬 정책' 개발이 핵심 경쟁력이 됨.

🔗 지식 연결 (Graph)