--- id: TRUST-AI-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 1.0 tags: [ai-ethics, trustworthy-ai, safety, bias, xai] last_reinforced: 2026-04-26 --- # Trustworthy AI (μ‹ λ’°ν•  수 μžˆλŠ” AI) ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μ„±λŠ₯보닀 μ€‘μš”ν•œ 것은 인간이 μ•ˆμ‹¬ν•˜κ³  μ‚¬μš©ν•  수 μžˆλŠ” κ°€μΉ˜μ  정렬이닀" β€” AI μ‹œμŠ€ν…œμ΄ μ˜λ„ν•œ λŒ€λ‘œ μž‘λ™ν•˜λ©°, 편ν–₯λ˜μ§€ μ•Šκ³ , μΈκ°„μ˜ ꢌ리λ₯Ό μΉ¨ν•΄ν•˜μ§€ μ•ŠμŒμ„ 보μž₯ν•˜λŠ” 기술적/윀리적 체계. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** AI의 결정이 투λͺ…ν•˜κ³ (Explainability), κ³΅μ •ν•˜λ©°(Fairness), λ³΄μ•ˆ 곡격에 κ°•ν•˜κ³ (Robustness), 법적/윀리적 μ±…μž„μ„ 질 수 μžˆλ„λ‘ μ„€κ³„ν•˜λŠ” μ‹ λ’° μ•„ν‚€ν…μ²˜ νŒ¨ν„΄. - **핡심 7λŒ€ μš”μ†Œ (EU κ°€μ΄λ“œλΌμΈ κΈ°μ€€):** - **Human Agency & Oversight:** μΈκ°„μ˜ ν†΅μ œκΆŒ μœ μ§€. - **Technical Robustness & Safety:** 였λ₯˜μ™€ 곡격에 λŒ€ν•œ 탄λ ₯μ„±. - **Privacy & Data Governance:** μ² μ €ν•œ 데이터 보호. - **Transparency:** μž‘λ™ 원리와 데이터 좜처 곡개. - **Diversity, Non-discrimination & Fairness:** 편ν–₯μ„± 제거. - **Societal & Environmental Well-being:** 지속 κ°€λŠ₯μ„± κ³ λ €. - **Accountability:** 결과에 λŒ€ν•œ μ±…μž„ 좔적성. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** 초기 AIλŠ” '정확도'만 λ†’μœΌλ©΄ μ„±κ³΅μœΌλ‘œ μ—¬κ²¨μ‘ŒμœΌλ‚˜, ν˜„λŒ€μ—λŠ” 신뒰성을 μžƒμ€ AIλŠ” μ‚¬νšŒμ μœΌλ‘œ 수용될 수 μ—†λ‹€λŠ” 인식이 확산됨. - **μ •μ±… λ³€ν™”:** Antigravity ν”„λ‘œμ νŠΈλŠ” λͺ¨λ“  지식 보강 μž‘μ—… μ‹œ 'μ‹ λ’°ν•  수 μžˆλŠ” AI' 원칙을 μ€€μˆ˜ν•˜λ©°, μƒμ„±λœ μ •λ³΄μ˜ μΆœμ²˜μ™€ 신뒰도λ₯Ό μ‚¬μš©μžμ—κ²Œ λͺ…ν™•νžˆ 고지함. ## πŸ”— 지식 μ—°κ²° (Graph) - AI-Safety, Explainable-AI, [[Alignment|Alignment]], [[Interpretability|Interpretability]] - **Raw Source:** 10_Wiki/Topics/AI/Trustworthy-AI.md