[G1-Sync] Manual knowledge update

2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
@@ -2,7 +2,7 @@
 id: RL-REWARD-SHAPE-001
 category: "10_Wiki/💡 Topics/AI"
 confidence_score: 1.0
-tags: [ai, reinforcement-learning, reward-shaping, reward-design, sparse-rewards, behavior-steering]
+tags: [ai, [[Reinforcement-Learning]], reward-shaping, reward-design, sparse-rewards, [[Behavior]]-steering]
 last_reinforced: 2026-04-26
 ---

@@ -12,7 +12,7 @@ last_reinforced: 2026-04-26
 > "최종 목표라는 커다란 보상을 향해 가기 위해, 에이전트의 발걸음마다 '올바른 방향'을 가리키는 작은 이정표(Sub-rewards)를 설계하라" — 보상이 희소한(Sparse Reward) 환경에서 학습 속도를 높이기 위해 보상 함수에 추가적인 지침을 더하는 기법.

 ## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Intermediate Incentivization and Alignment Steering" — 최종 성공 시에만 보상을 주는 대신, 목표에 가까워지는 상태 전이마다 보상을 부여하여 에이전트가 '무엇이 좋은 행동인지'를 빠르게 파악하게 만드는 패턴.
+- **추출된 패턴:** "Intermediate Incentivization and [[Alignment]] Steering" — 최종 성공 시에만 보상을 주는 대신, 목표에 가까워지는 상태 전이마다 보상을 부여하여 에이전트가 '무엇이 좋은 행동인지'를 빠르게 파악하게 만드는 패턴.
 - **주요 고려 사항:**
    - **Potential-based Reward Shaping:** 정책의 최적성을 해치지 않으면서 보상을 추가하는 수학적 기법.
    - **Reward Hacking Risk:** 에이전트가 개발자의 의도와 달리 꼼수를 써서 보상만 극대화하는 부작용 주의.