docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
@@ -1,12 +1,12 @@
 ---
-id: [[P-Reinforce]]-AUTO-SEST-001
+id: [[P-Reinforce|P-Reinforce]]-AUTO-SEST-001
 category: "10_Wiki/💡 Topics/AI"
 confidence_score: 0.95
-tags: [auto-reinforced, [[Search]]-[[Strategy]], focus-search, heuristic, algorithm, exploration-exploitation]
+tags: [auto-reinforced, [[Search|Search]]-[[Strategy|Strategy]], focus-search, heuristic, algorithm, exploration-exploitation]
 last_reinforced: 2026-04-20
 ---

-# [[Search-Strategy]]
+# [[Search-Strategy|Search-Strategy]]

 ## 📌 한 줄 통찰 (The Karpathy Summary)
 > "탐험의 전술: 무작정 덤벼들지 않고, 이미 아는 좋은 곳을 더 깊게 팔지(Exploitation), 아니면 새로운 곳을 찾아 떠날지(Exploration) 사이에서 완벽한 균형을 잡으며 목표를 타격하는 지능적 행동 방침."
@@ -17,9 +17,9 @@ last_reinforced: 2026-04-20
 1.  **대표적 전략 도구**:
    *   **BFS (Breadth-First)**: 넓고 얕게 훑음 (안정성).
    *   **DFS (Depth-First)**: 한 우물만 깊게 파봄 (속도).
-    *   **Heuristic Search**: 경험적 힌트를 사용해 정답에 가까운 곳부터 뒤짐 (A* 알고리즘 등). ([[Optimization]]와 연결)
-2.  **핵심 딜레마 ([[Exploration vs Exploitation]])**:
-    *   새로운 가능성을 찾을 것인가, 아니면 검증된 최고점을 다듬을 것인가? ([[Reinforcement Learning (RL)]]의 영원한 숙제).
+    *   **Heuristic Search**: 경험적 힌트를 사용해 정답에 가까운 곳부터 뒤짐 (A* 알고리즘 등). ([[Optimization|Optimization]]와 연결)
+2.  **핵심 딜레마 ([[Exploration vs Exploitation|Exploration vs Exploitation]])**:
+    *   새로운 가능성을 찾을 것인가, 아니면 검증된 최고점을 다듬을 것인가? ([[Reinforcement Learning (RL)|Reinforcement Learning (RL)]]의 영원한 숙제).
 3.  **왜 중요한가?**:
    *   훌륭한 전략은 수만 년 걸릴 탐색 시간을 단 몇 분으로 줄여주며, 시스템의 '반응 속도'와 '정확도' 사이의 최적점(Sweet spot)을 결정하기 때문임.

@@ -28,6 +28,6 @@ last_reinforced: 2026-04-20
 - **정책 변화(RL Update)**: 본 지식 베이스 구축 정책에서도, 대표님의 피드백 정책에 따라 특정 주제 정책을 더 깊게 팔지(Deep-dive), 아니면 일단 전체 개수 정책을 채울지(Breadth)를 조절하는 것이 고수준의 탐색 전략 정책임.

 ## 🔗 지식 연결 (Graph)
- [[Optimization]], [[Reinforcement Learning (RL)]], [[Efficiency]], [[Search-Space]], [[Mastery]]
+- [[Optimization|Optimization]], [[Reinforcement Learning (RL)|Reinforcement Learning (RL)]], [[Efficiency|Efficiency]], [[Search-Space|Search-Space]], [[Mastery|Mastery]]
 - **Modern Tech/Tools**: A* algorithm, Greedy search, Beam search, Monte Carlo Tree Search.
 ---