[G1-Sync] Manual knowledge update

2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
@@ -1,8 +1,8 @@
 ---
-id: P-REINFORCE-AUTO-JOOP-001
+id: [[P-Reinforce]]-AUTO-JOOP-001
 category: "10_Wiki/💡 Topics/AI"
 confidence_score: 0.91
-tags: [auto-reinforced, joint-optimization, system-design, end-to-end, synergetic-optimization]
+tags: [auto-reinforced, joint-[[Optimization]],[[ system]]-design, end-to-end, synergetic-optimization]
 last_reinforced: 2026-04-20
 ---

@@ -16,9 +16,9 @@ last_reinforced: 2026-04-20

 1.  **주요 개념**:
    *   **End-to-End Learning**: 데이터 입력부터 최종 출력까지 중간 단계 없이 하나의 신경망으로 통째로 최적화. (Deep Learning (DL)의 철학)
-    *   **Hardware-Software Co-design**: 소프트웨어 로직과 반도체 설계를 동시에 최적화하여 압도적 성능 달성. (Hardware와 연결)
+    *   **[[Hardware]]-Software Co-design**: 소프트웨어 로직과 반도체 설계를 동시에 최적화하여 압도적 성능 달성. (Hardware와 연결)
 2.  **왜 중요한가?**:
-    *   각 부분은 최선일지라도 그들의 연결점에서 병목(Bottleneck)이 생기는 것을 원천 봉쇄하여 전체 시스템의 효율을 극대화함. (Efficiency와 연결)
+    *   각 부분은 최선일지라도 그들의 연결점에서 병목(Bottleneck)이 생기는 것을 원천 봉쇄하여 전체 시스템의 효율을 극대화함. ([[Efficiency]]와 연결)

 ## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
 - **과거 데이터와의 충돌**: 과거에는 복잡성을 줄이기 위해 각 단계를 독립적으로 분리하여 관리하는 '모듈화 정책'이 우세했으나, 현대 정책은 최고 성능을 위해 모듈 간의 경계를 허물고 동시에 학습/설계하는 '통합 정책'이 대세가 됨(RL Update).