id, title, category, status, canonical_id, duplicate_of, aliases, source_trust_level, confidence_score, verification_status, tags, last_reinforced, github_commit
| id |
title |
category |
status |
canonical_id |
duplicate_of |
aliases |
source_trust_level |
confidence_score |
verification_status |
tags |
last_reinforced |
github_commit |
| wiki-2026-0508-ps-reinforce |
Ps Reinforce |
10_Wiki/Topics |
duplicate |
p-reinforce |
P-Reinforce |
|
A |
0.9 |
redirected |
| duplicate |
| reinforcement-learning |
|
2026-05-10 |
pending |
Ps Reinforce
이 문서는 P-Reinforce 의 중복본입니다. Canonical 문서로 redirect.
핵심 요약
- 매 plural / typo variant alias.
- Canonical 의 REINFORCE policy gradient (Williams 1992) 설명 의 reference.
🔗 Graph
🕓 변경 이력
| 날짜 |
변경 |
| 2026-05-08 |
Phase 1 |
| 2026-05-10 |
중복 처리 — canonical 문서로 redirect |