[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,5 +1,5 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-HITL
|
||||
id: [[P-Reinforce]]-AI-HITL
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.99
|
||||
tags: [AI, HITL, AISafety, Collaboration]
|
||||
@@ -14,9 +14,9 @@ last_reinforced: 2026-04-20
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **Why HITL?**: AI는 확률에 기반하므로 '엣지 케이스'에서 치명적인 실수를 할 수 있다. 인간은 맥락과 도덕적 가치를 판단하여 이를 보완한다.
|
||||
- **Workflow**:
|
||||
- AI가 초안/예측 생성 -> 인간이 검토 및 수정(Verification) -> 수정된 데이터가 다시 AI 학습에 사용(Active Learning).
|
||||
- AI가 초안/예측 생성 -> 인간이 검토 및 수정(Verification) -> 수정된 데이터가 다시 AI 학습에 사용([[Active Learning]]).
|
||||
- **Core Benefit**:
|
||||
- **Reliability**: 실시간 사고 방지.
|
||||
- **[[Reliability]]**: 실시간 사고 방지.
|
||||
- **Continuous Improvement**: 고품질 정답지(Ground Truth)를 인간이 제공하여 성능 가속화.
|
||||
- **Domain**: 의료 진단 보조, 자율주행 모니터링, 콘텐츠 모더레이션.
|
||||
|
||||
@@ -25,4 +25,4 @@ last_reinforced: 2026-04-20
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: Active-Learning , RLHF (인간 피드백 기반 강화학습)
|
||||
- Strategy: Red-Teaming
|
||||
- [[Strategy]]: Red-Teaming
|
||||
|
||||
Reference in New Issue
Block a user