bluemsi/2nd

Files

T

Antigravity Agent c36c0644a1 [G1-Sync] Manual knowledge update

2026-04-30 22:42:02 +09:00

1.7 KiB

Raw Blame History

id: P-Reinforce-AI-HITL category: "10_Wiki/💡 Topics/AI" confidence_score: 0.99 tags: [AI, HITL, AISafety, Collaboration] last_reinforced: 2026-04-20

Human-in-the-loop (HITL) (인간 개입형 시스템)

📌 한 줄 통찰 (The Karpathy Summary)

"AI의 자율성과 인간의 판단력이 만나는 가장 안전한 지점." AI가 100% 결정을 내리는 것이 아니라, 중요한 판단이나 모호한 상황에서 인간이 루프(Loop)에 개입하여 정확도를 높이고 윤리적 책임을 지는 구조다.

📖 구조화된 지식 (Synthesized Content)

Why HITL?: AI는 확률에 기반하므로 '엣지 케이스'에서 치명적인 실수를 할 수 있다. 인간은 맥락과 도덕적 가치를 판단하여 이를 보완한다.
Workflow:
- AI가 초안/예측 생성 -> 인간이 검토 및 수정(Verification) -> 수정된 데이터가 다시 AI 학습에 사용(Active Learning).
Core Benefit:
- Reliability: 실시간 사고 방지.
- Continuous Improvement: 고품질 정답지(Ground Truth)를 인간이 제공하여 성능 가속화.
Domain: 의료 진단 보조, 자율주행 모니터링, 콘텐츠 모더레이션.

⚠️ 모순 및 업데이트 (RL Update)

인간이 루프에 끼어들면 시스템의 스케일링(속도)이 급격히 떨어진다. 이를 해결하기 위해 '모든 작업 감시'에서 '불확실성이 높은 작업만 호출'하는 방식으로 인간의 개입을 최적화하는 연구가 중요하다. 또한 인간 관리자도 피로로 인해 오판할 수 있음을 고려해야 한다.

🔗 지식 연결 (Graph)

Related: Active-Learning , RLHF (인간 피드백 기반 강화학습)
Strategy: Red-Teaming