--- id: wiki-2026-0508-ps-reinforce title: Ps Reinforce category: 10_Wiki/Topics status: duplicate canonical_id: p-reinforce duplicate_of: "[[P-Reinforce]]" aliases: [] source_trust_level: A confidence_score: 0.9 verification_status: redirected tags: [duplicate, reinforcement-learning] last_reinforced: 2026-05-10 github_commit: pending --- # Ps Reinforce > **이 문서는 [[P-Reinforce]] 의 중복본입니다.** Canonical 문서로 redirect. ## 핵심 요약 - 매 plural / typo variant alias. - Canonical 의 REINFORCE policy gradient (Williams 1992) 설명 의 reference. ## 🔗 Graph - 부모: [[P-Reinforce]] (canonical) ## 🕓 변경 이력 | 날짜 | 변경 | |---|---| | 2026-05-08 | Phase 1 | | 2026-05-10 | 중복 처리 — canonical 문서로 redirect |