[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-LOSE-001
|
||||
id: [[P-Reinforce]]-AUTO-LOSE-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.93
|
||||
tags: [auto-reinforced, local-search, optimization, hill-climbing, algorithms, search-strategy]
|
||||
tags: [auto-reinforced, local-[[Search]], [[Optimization]], hill-climbing, algorithms, [[Search-Strategy]]]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
@@ -16,16 +16,16 @@ last_reinforced: 2026-04-20
|
||||
|
||||
1. **주요 알고리즘**:
|
||||
* **Hill Climbing**: 지금보다 더 높은 곳이 보이면 무조건 이동. (하지만 정상인지 언덕인지 모름)
|
||||
* **Simulated Annealing**: 가끔은 낮은 곳으로도 가보며 더 큰 정상을 찾음 (금속 담금질 원리). (Search-Optimization와 연결)
|
||||
* **Simulated Annealing**: 가끔은 낮은 곳으로도 가보며 더 큰 정상을 찾음 (금속 담금질 원리). ([[Search-Optimization]]와 연결)
|
||||
* **Tabu Search**: 한 번 가본 곳은 목록에 적어두고 다시 가지 않음.
|
||||
2. **왜 중요한가?**:
|
||||
* 문제의 규모가 너무 커서 전체를 다 탐색(Global Search)할 수 없을 때, '충분히 좋은 답'을 빠르게 내놓는 최선의 방법임.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌**: 과거에는 동네 뒷산(Local Optima)에 갇혀버린다는 것이 치명적 약점 정책이었으나, 현대 정책은 무작위성(Randomness) 정책을 적절히 섞어 이를 탈출하는 정교한 기법들이 표준 정책이 됨(RL Update).
|
||||
- **정책 변화(RL Update)**: 딥러닝 가중치를 찾는 경사 하강법(Gradient-Descent) 자체가 일종의 연속 공간에서의 국소 탐색 정책이며, 이를 가속화하고 탈출하기 위한 다양한 모멘텀(Momentum) 정책이 현대 AI의 핵심 엔진이 됨.
|
||||
- **정책 변화(RL Update)**: 딥러닝 가중치를 찾는 경사 하강법([[Gradient-Descent]]) 자체가 일종의 연속 공간에서의 국소 탐색 정책이며, 이를 가속화하고 탈출하기 위한 다양한 모멘텀(Momentum) 정책이 현대 AI의 핵심 엔진이 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Search-Optimization]], [[Gradient-Descent]], [[Combinatorial-Optimization]], [[Heuristics]], [[Optimization]]
|
||||
- **Modern Tech/Tools**: Genetic algorithms, GRASP, Local solver, Meta-heuristics.
|
||||
- **Modern Tech/Tools**: Genetic algorithms, GRASP, Local solver, Meta-[[Heuristics]].
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user