---
id: AI-ROBUST-001
category: Dev
confidence_score: 1.0
tags: [ai, machine-learning, [[Robustness|Robustness]], adversarial-attacks, ood-detection, [[Reliability|Reliability]], [[Trustworthy-AI|Trustworthy-AI]]]
last_reinforced: 2026-04-26
---

# Robust Machine Learning (강건한 머신러닝)

## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 노이즈와 적대적 공격이라는 폭풍우 속에서도 흔들리지 않는 '강건한 지능'을 구축하고, 낯선 환경에서도 신뢰할 수 있는 판단의 일관성을 유지하라" — 모델이 입력 데이터의 변동, 노이즈, 혹은 의도적인 왜곡(Adversarial Perturbation)에 대해 안정적인 성능을 유지하도록 만드는 머신러닝 방법론.

## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Adversarial Defense and Uncertainty Awareness" — 학습 과정에서 의도적으로 어려운 샘플을 주입하여 단련시키고(Adversarial Training), 자신이 모르는 데이터(OOD)에 대해서는 "모른다"고 답할 수 있는 확신도(Confidence)를 관리하는 패턴.
- **핵심 도전 과제:**
    - **Adversarial Attacks:** 사람 눈에는 보이지 않는 미세한 변조로 모델을 속이는 공격 방어.
    - **Distribution [[Shift|Shift]]:** 학습 데이터와 실제 데이터의 분포가 달라질 때의 성능 하락 방지.
    - **Data Corruption:** 데이터 수집 과정의 결측이나 오류에 대한 저항력 확보.
- **의의:** 자율주행, 의료 진단, 안보 등 작은 오류가 치명적인 결과를 초래하는 '미션 크리티컬' 분야에서 AI가 상용화되기 위한 필수 조건.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 정확도(Accuracy)만 높으면 좋은 모델이라는 지표 지상주의에서 벗어나, 이제는 최악의 상황에서도 얼마나 안정적인지(Worst-case Robustness)가 모델의 진정한 가치를 결정하는 핵심 척도가 됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 판단 로직 배포 전, 적대적 샘플 테스트와 이상 데이터 탐지 성능을 반드시 검증하여 예외 상황에 대한 강건성을 확보하는 'Robust-First' 정책을 고수함.

## 🔗 지식 연결 (Graph)
- [[Trustworthy-AI|Trustworthy-AI]], Adversarial-Machine-Learning, OOD-Detection-Techniques, [[Outlier-Detection-Techniques|Outlier-Detection-Techniques]]
- **Raw Source:** 10_Wiki/Topics/AI/Robust-Machine-Learning.md