Files
2nd/10_Wiki/Topics_GD/Optimization.md
T

2.4 KiB


id: P-Reinforce-AUTO-OPTI-001 category: "10_Wiki/💡 Topics/AI" confidence_score: 0.99 tags: [auto-reinforced, optimization, algorithms, Efficiency, mathematical-programming, improvement] last_reinforced: 2026-04-20

Optimization

📌 한 줄 통찰 (The Karpathy Summary)

"최선을 향한 끊임없는 탐구: 주어진 조건 속에서 무엇(이득, 성능)을 최대화하거나 무엇(비용, 고통)을 최소화하는 최적의 해답을 수학적으로 찾아내는 기술이자, 모든 인적·기계적 진보를 이끄는 '가장 효율적인 상태'로의 지향."

📖 구조화된 지식 (Synthesized Content)

최적화(Optimization)는 특정 목적 함수를 가장 만족시키는 해를 찾는 과정입니다.

  1. 3대 구성 요소:
    • Objective Function: 극대화 또는 극소화할 목표.
    • Variables: 우리가 조정할 수 있는 통제 변수.
    • Constraints: 우리가 지켜야 할 현실적 제약 조건들.
  2. 왜 중요한가?:
    • 지능(Intelligence)은 결국 한정된 자원으로 최선의 목표를 달성하는 '최적화 능력'의 다른 이름이며, AI 학습 자체가 오류를 최소화하는 거대한 최적화 연산이기 때문임. (Gradient-Descent와 연결)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 한 번에 정답을 찾는 '분석적 정책(Analytical)'을 선호했으나, 현대 정책은 거대 변수 앞에서는 조금씩 고쳐가며 답에 근접하는 '반복적 경사 하강 정책(Iterative)'이 압도적 실용 정책을 가짐(RL Update). (Iteration와 연결)
  • 정책 변화(RL Update): 단순히 현재의 최적 정책(Local Optima)에 만족하지 않고, 전역 최적해(Global Optima)를 찾기 위해 탐색 공간을 뒤흔드는 '하이퍼파라미터 튜닝 정책'과 '강화 학습 정책'이 현대 AI 최적화의 꽃이 됨.

🔗 지식 연결 (Graph)