33 lines
2.6 KiB
Markdown
33 lines
2.6 KiB
Markdown
---
|
|
id: [[P-Reinforce|P-Reinforce]]-AUTO-EADI-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.95
|
|
tags: [auto-reinforced, evolutionary-algorithm, genetic-algorithm, [[Optimization|Optimization]], heuristic, bio-inspired, [[Search-Strategy|Search-Strategy]]]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Evolutionary-Algorithm-Design|Evolutionary-Algorithm-Design]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "코드로 구현한 자연택: 정답을 모르는 복잡한 문제 공간에서, 수많은 후보해(개체)를 생성하고 경쟁시켜 우수한 것만 '생존'시키고 '교배'와 '변이'를 거치게 하여, 결국 최적의 정답으로 스스로 진화하게 만드는 최적화 기법."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
진화 알고리즘(Evolutionary-Algorithm-Design)은 다윈의 적자생존 원리에 기반한 확률적 최적화 탐색 방법론입니다.
|
|
|
|
1. **4대 핵심 연산**:
|
|
* **Selection**: 적합도(Fitness score)가 높은 개체를 다음 세대의 부모로 선택.
|
|
* **Crossover (Recombination)**: 부모의 '유전자(데이터)'를 섞어 새로운 자손 생성.
|
|
* **Mutation**: 무작위 변이를 주어 가끔 새로운 지역을 탐색 (Local Optima 탈출). ([[Search|Search]]-[[Strategy|Strategy]]와 연결)
|
|
* **Replacement**: 새로운 개체들로 인구 집단 업데이트.
|
|
2. **왜 중요한가?**:
|
|
* 미분 불가능하거나 수학적으로 정의하기 힘든 '블랙박스' 문제 상에서 가장 강력한 해 찾기 정책을 보여주기 때문임. (Optimization와 연결)
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 계산 비용 정책이 너무 비싸 외면받기도 했으나, 현대 정책은 강력한 병렬 컴퓨팅 정책(GPU)을 만나 거대 AI 모델의 구조 자체를 진화시키는 'NAS(Neural [[Architecture|Architecture]] Search)' 분야에서 화려하게 부활함(RL Update).
|
|
- **정책 변화(RL Update)**: 이제는 단순 유전 알고리즘 정책을 넘어, AI 가 스스로 진화 전략 정책을 설계(Auto-EA)하거나 강화학습과 결합하여 환경 변화에 실시간으로 적응하는 '자기 진화형 에이전트' 설계의 핵심 논리로 쓰임. ([[Reinforcement Learning (RL)|Reinforcement Learning (RL)]]와 연결)
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Search-Strategy|Search-Strategy]], [[Optimization|Optimization]], [[Reinforcement Learning (RL)|Reinforcement Learning (RL)]], [[Complexity-Theory|Complexity-Theory]], Generalization, Deep Learning (DL)
|
|
- **Key Types**: Genetic Algorithms (GA), Evolution Strategies (ES).
|
|
---
|