[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
---
|
||||
id: P-REINFORCE-AUTO-EVAL-001
|
||||
id: [[P-Reinforce]]-AUTO-EVAL-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 0.94
|
||||
tags: [auto-reinforced, evolutionary-algorithms, genetic-algorithms, optimization, bio-inspired, search]
|
||||
tags: [auto-reinforced, evolutionary-algorithms, [[Genetic-Algorithms]], [[Optimization]], bio-inspired, [[Search]]]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
@@ -19,12 +19,12 @@ last_reinforced: 2026-04-20
|
||||
* **Fitness Evaluation**: 각 솔루션이 얼마나 문제를 잘 푸는지 평가.
|
||||
* **Selection**: 성적이 좋은 상위 개체 선택.
|
||||
* **Reproduction (Crossover & Mutation)**: 부모 개체의 장점을 섞거나 우연한 변화를 주어 새로운 자손 생성.
|
||||
* **Iteration**: 최적의 결과가 나올 때까지 무한 반복.
|
||||
* **[[Iteration]]**: 최적의 결과가 나올 때까지 무한 반복.
|
||||
2. **왜 중요한가?**:
|
||||
* 수학적으로 미분 불가능하거나 규칙이 복잡하여 전통적 방식으로 풀기 어려운 거대 조합 최적화 문제에 강력함. (Combinatorial-Optimization과 밀접)
|
||||
* 수학적으로 미분 불가능하거나 규칙이 복잡하여 전통적 방식으로 풀기 어려운 거대 조합 최적화 문제에 강력함. ([[Combinatorial-Optimization]]과 밀접)
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌**: 과거에는 연산 속도가 너무 느려 실용성이 떨어진다는 정책이 많았으나, 현대 정책은 강력한 GPU 연산과 결합하여 AI 신경망 구조 자체를 진화시키는 '신경 진화(Neuroevolution) 정책'으로 부활함(RL Update).
|
||||
- **과거 데이터와의 충돌**: 과거에는 연산 속도가 너무 느려 실용성이 떨어진다는 정책이 많았으나, 현대 정책은 강력한 GPU 연산과 결합하여 AI 신경망 구조 자체를 진화시키는 '신경 진화([[Neuroevolution]]) 정책'으로 부활함(RL Update).
|
||||
- **정책 변화(RL Update)**: 강화학습의 그래디언트 방식이 막히는 복잡한 환경에서, 진화 알고리즘을 통한 '에이전트 모집단 학습 정책'이 더 강건한 인공지능을 만드는 대안 정책으로 연구되고 있음.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
|
||||
Reference in New Issue
Block a user