[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+4 -4
View File
@@ -1,5 +1,5 @@
---
id: P-REINFORCE-AI-HITL
id: [[P-Reinforce]]-AI-HITL
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.99
tags: [AI, HITL, AISafety, Collaboration]
@@ -14,9 +14,9 @@ last_reinforced: 2026-04-20
## 📖 구조화된 지식 (Synthesized Content)
- **Why HITL?**: AI는 확률에 기반하므로 '엣지 케이스'에서 치명적인 실수를 할 수 있다. 인간은 맥락과 도덕적 가치를 판단하여 이를 보완한다.
- **Workflow**:
- AI가 초안/예측 생성 -> 인간이 검토 및 수정(Verification) -> 수정된 데이터가 다시 AI 학습에 사용(Active Learning).
- AI가 초안/예측 생성 -> 인간이 검토 및 수정(Verification) -> 수정된 데이터가 다시 AI 학습에 사용([[Active Learning]]).
- **Core Benefit**:
- **Reliability**: 실시간 사고 방지.
- **[[Reliability]]**: 실시간 사고 방지.
- **Continuous Improvement**: 고품질 정답지(Ground Truth)를 인간이 제공하여 성능 가속화.
- **Domain**: 의료 진단 보조, 자율주행 모니터링, 콘텐츠 모더레이션.
@@ -25,4 +25,4 @@ last_reinforced: 2026-04-20
## 🔗 지식 연결 (Graph)
- Related: Active-Learning , RLHF (인간 피드백 기반 강화학습)
- Strategy: Red-Teaming
- [[Strategy]]: Red-Teaming