Files
2nd/10_Wiki/Topics/AI_and_ML/Ethics & AI.md
T

3.5 KiB

id, title, category, status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, tags, raw_sources, last_reinforced, github_commit, inferred_by
id title category status canonical_id aliases duplicate_of source_trust_level confidence_score tags raw_sources last_reinforced github_commit inferred_by
wiki-2026-0508-ethics-ai Ethics & AI 10_Wiki/Topics needs_review self
P-Reinforce-AUTO-ETAI-001
none A 0.98
auto-reinforced
ethics
ai-ethics
Alignment
safety
responsibility
bias
2026-04-20 pending Claude Opus 4.7 (auto-normalize 2026-05-08)

Ethics & AI

📌 한 줄 통찰 (The Karpathy Summary)

"기계의 도덕적 나침반: 지능을 가진 기계가 인간을 해치지 않고 보편적 가치에 부합하도록 설계되었는가?라는 질문에 답하기 위해, 알고리즘 이면의 책임성, 투명성, 공정성을 끊임없이 감시하고 정렬하는 AI 시대의 규범적 기둥."

📖 구조화된 지식 (Synthesized Content)

AI 윤리(Ethics & AI)는 AI 시스템의 개발과 사용에서 발생하는 도덕적 문제를 연구하는 학문입니다.

  1. 핵심 원칙 (UNESCO/OECD 기준):
    • Transparency (투명성): AI가 왜 그런 결정을 내렸는지 설명 가능해야 함. (XAI와 연결)
    • Fairness (공정성): 특정 집단에 비우호적인 결과가 나오지 않도록 관리. (Equality와 연결)
    • Safety & Security: 해킹이나 오작동으로 인한 물리적/정신적 피해 방지. (AI Safety와 연결)
    • Responsibility (책임성): 사고 발생 시 누가 책임을 지는가에 대한 법적/윤리적 주체 명확화.
  2. 왜 중요한가?:
    • 기술이 통제를 벗어나 인간의 존엄성을 위협하는 것을 막고, 지속 가능한 인공지능 발전을 위한 사회적 합의의 기초가 됨.

⚠️ 모순 및 업데이트 (Contradictions & Updates)

  • 과거 데이터와의 충돌: 과거에는 성능만 좋으면 장땡이라는 '기술 만능주의 정책'이 우세했으나, 현대 정책은 윤리적 정렬(Alignment) 없이는 서비스 출시 자체가 불가능한 '윤리 우선 배포 정책'으로 완전히 전환됨(RL Update). (Constitutional AI와 연결)
  • 정책 변화(RL Update): 단순히 '나쁜 말 하지 않기' 수준을 넘어, 기계가 인간의 '미묘한 의도(Nuance)'와 '맥락적 공감'을 통해 최선의 선을 행하도록 하는 '강력한 정렬 정책' 개발이 핵심 경쟁력이 됨.

🔗 지식 연결 (Graph)


🤖 LLM 활용 힌트 (How to Use This Knowledge)

언제 이 지식을 쓰는가:

  • (TODO)

언제 쓰면 안 되는가:

  • (TODO)

🧪 검증 상태 (Validation)

  • 정보 상태: needs_review
  • 출처 신뢰도: A
  • 검토 이유: (P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)

🧬 중복 검사 (Duplicate Check)

  • 기존 유사 문서: (TODO: 인덱서 클러스터 리포트 참조)
  • 처리 방식: UPDATE (자동 정규화)
  • 처리 이유: Phase 1 정규화 — 옛 템플릿/누락 필드 보강.

🕓 변경 이력 (Changelog)

날짜 변경 내용 처리 방식 신뢰도
2026-05-08 P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) UPDATE A