docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [Alignment, RLAIF, AISafety, Scalability]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[RLAIF (AI 피드백 기반 강화학습)]]
|
||||
# [[RLAIF (AI 피드백 기반 강화학습)|RLAIF (AI 피드백 기반 강화학습)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "인간의 자리를 더 똑똑한 AI가 대신하는 정렬 가속기." 인간의 피드백(RLHF) 대신 고성능 AI 모델이 생성한 피드백을 사용하여 다른 모델을 정렬하고 학습시키는 기술이다.
|
||||
@@ -23,5 +23,5 @@ last_reinforced: 2026-04-20
|
||||
- 'AI가 AI를 가르친다'는 점에서 편항의 증폭이나 모델 붕괴(Model Collapse)의 우려가 있다. 이를 막기 위해 인간 감시자(Human Overseer)가 루프에 포함되어 AI의 평가 기준이 올바른지 정기적으로 검사하는 하이브리드 방식이 권장된다.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: [[Constitutional AI (헌법 AI)]] , RLHF (인간 피드백 기반 강화학습)
|
||||
- Related: [[Constitutional AI (헌법 AI)|Constitutional AI (헌법 AI)]] , RLHF (인간 피드백 기반 강화학습)
|
||||
- Risk: Model Collapse (모델 붕괴 현상)
|
||||
|
||||
Reference in New Issue
Block a user