[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-SEST-001
|
||||
id: [[P-Reinforce]]-AUTO-SEST-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.95
|
||||
tags: [auto-reinforced, search-strategy, focus-search, heuristic, algorithm, exploration-exploitation]
|
||||
tags: [auto-reinforced, [[Search]]-[[Strategy]], focus-search, heuristic, algorithm, exploration-exploitation]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
@@ -17,9 +17,9 @@ last_reinforced: 2026-04-20
|
||||
1. **대표적 전략 도구**:
|
||||
* **BFS (Breadth-First)**: 넓고 얕게 훑음 (안정성).
|
||||
* **DFS (Depth-First)**: 한 우물만 깊게 파봄 (속도).
|
||||
* **Heuristic Search**: 경험적 힌트를 사용해 정답에 가까운 곳부터 뒤짐 (A* 알고리즘 등). (Optimization와 연결)
|
||||
2. **핵심 딜레마 (Exploration vs Exploitation)**:
|
||||
* 새로운 가능성을 찾을 것인가, 아니면 검증된 최고점을 다듬을 것인가? (Reinforcement Learning (RL)의 영원한 숙제).
|
||||
* **Heuristic Search**: 경험적 힌트를 사용해 정답에 가까운 곳부터 뒤짐 (A* 알고리즘 등). ([[Optimization]]와 연결)
|
||||
2. **핵심 딜레마 ([[Exploration vs Exploitation]])**:
|
||||
* 새로운 가능성을 찾을 것인가, 아니면 검증된 최고점을 다듬을 것인가? ([[Reinforcement Learning (RL)]]의 영원한 숙제).
|
||||
3. **왜 중요한가?**:
|
||||
* 훌륭한 전략은 수만 년 걸릴 탐색 시간을 단 몇 분으로 줄여주며, 시스템의 '반응 속도'와 '정확도' 사이의 최적점(Sweet spot)을 결정하기 때문임.
|
||||
|
||||
|
||||
Reference in New Issue
Block a user