2.5 KiB
2.5 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| AI-ROBUST-001 | 10_Wiki/💡 Topics/AI | 1.0 |
|
2026-04-26 |
Robust Machine Learning (강건한 머신러닝)
📌 한 줄 통찰 (The Karpathy Summary)
"데이터의 노이즈와 적대적 공격이라는 폭풍우 속에서도 흔들리지 않는 '강건한 지능'을 구축하고, 낯선 환경에서도 신뢰할 수 있는 판단의 일관성을 유지하라" — 모델이 입력 데이터의 변동, 노이즈, 혹은 의도적인 왜곡(Adversarial Perturbation)에 대해 안정적인 성능을 유지하도록 만드는 머신러닝 방법론.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: "Adversarial Defense and Uncertainty Awareness" — 학습 과정에서 의도적으로 어려운 샘플을 주입하여 단련시키고(Adversarial Training), 자신이 모르는 데이터(OOD)에 대해서는 "모른다"고 답할 수 있는 확신도(Confidence)를 관리하는 패턴.
- 핵심 도전 과제:
- Adversarial Attacks: 사람 눈에는 보이지 않는 미세한 변조로 모델을 속이는 공격 방어.
- Distribution Shift: 학습 데이터와 실제 데이터의 분포가 달라질 때의 성능 하락 방지.
- Data Corruption: 데이터 수집 과정의 결측이나 오류에 대한 저항력 확보.
- 의의: 자율주행, 의료 진단, 안보 등 작은 오류가 치명적인 결과를 초래하는 '미션 크리티컬' 분야에서 AI가 상용화되기 위한 필수 조건.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 단순히 정확도(Accuracy)만 높으면 좋은 모델이라는 지표 지상주의에서 벗어나, 이제는 최악의 상황에서도 얼마나 안정적인지(Worst-case Robustness)가 모델의 진정한 가치를 결정하는 핵심 척도가 됨.
- 정책 변화: Antigravity 프로젝트는 에이전트의 판단 로직 배포 전, 적대적 샘플 테스트와 이상 데이터 탐지 성능을 반드시 검증하여 예외 상황에 대한 강건성을 확보하는 'Robust-First' 정책을 고수함.
🔗 지식 연결 (Graph)
- Trustworthy-AI, Adversarial-Machine-Learning, OOD-Detection-Techniques, Outlier-Detection-Techniques
- Raw Source: 10_Wiki/Topics/AI/Robust-Machine-Learning.md