32 lines
2.2 KiB
Markdown
32 lines
2.2 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-LOSE-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.93
|
|
tags: [auto-reinforced, local-search, optimization, hill-climbing, algorithms, search-strategy]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Local-Search]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "현재보다 나은 내일을 위해: 전체 지도를 다 보지 않아도, 지금 서 있는 곳에서 주변을 훑어보고 조금이라도 더 높은 곳(혹은 낮은 곳)으로 한 발자국씩 옮기며 최적의 목표를 찾아가는 현실적이고 민첩한 탐색 기법."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
국소 탐색(Local-Search)은 현재의 해를 조금씩 수정하여 더 나은 해를 찾아가는 알고리즘입니다.
|
|
|
|
1. **주요 알고리즘**:
|
|
* **Hill Climbing**: 지금보다 더 높은 곳이 보이면 무조건 이동. (하지만 정상인지 언덕인지 모름)
|
|
* **Simulated Annealing**: 가끔은 낮은 곳으로도 가보며 더 큰 정상을 찾음 (금속 담금질 원리). (Search-Optimization와 연결)
|
|
* **Tabu Search**: 한 번 가본 곳은 목록에 적어두고 다시 가지 않음.
|
|
2. **왜 중요한가?**:
|
|
* 문제의 규모가 너무 커서 전체를 다 탐색(Global Search)할 수 없을 때, '충분히 좋은 답'을 빠르게 내놓는 최선의 방법임.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 동네 뒷산(Local Optima)에 갇혀버린다는 것이 치명적 약점 정책이었으나, 현대 정책은 무작위성(Randomness) 정책을 적절히 섞어 이를 탈출하는 정교한 기법들이 표준 정책이 됨(RL Update).
|
|
- **정책 변화(RL Update)**: 딥러닝 가중치를 찾는 경사 하강법(Gradient-Descent) 자체가 일종의 연속 공간에서의 국소 탐색 정책이며, 이를 가속화하고 탈출하기 위한 다양한 모멘텀(Momentum) 정책이 현대 AI의 핵심 엔진이 됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Search-Optimization]], [[Gradient-Descent]], [[Combinatorial-Optimization]], [[Heuristics]], [[Optimization]]
|
|
- **Modern Tech/Tools**: Genetic algorithms, GRASP, Local solver, Meta-heuristics.
|
|
---
|