Files
2nd/10_Wiki/Topics_Blog/Iteration.md
T

32 lines
2.1 KiB
Markdown

---
id: P-REINFORCE-AUTO-ITER-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.96
tags: [auto-reinforced, iteration, loops, recursion, computer-science, repetitive-tasks]
last_reinforced: 2026-04-20
---
# [[Iteration|Iteration]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "기능의 되풀이, 지능의 축적: 복잡한 작업을 단순한 작은 단계로 나누어 목표를 달성할 때까지 끈질기게 반복 실행함으로써, 단 한 번의 시도로는 불가능한 정교한 결과물을 빚어내는 컴퓨팅적 인내."
## 📖 구조화된 지식 (Synthesized Content)
반복(Iteration)은 동일한 절차를 여러 번 되풀이하는 컴퓨터 과학과 사고의 기본 원리입니다.
1. **구현 방식**:
* **Loops**: 정해진 횟수(for)나 조건(while)이 만족될 때까지 코드 블록 실행.
* **Recursion**: 함수가 자기 자신을 호출하여 문제를 작게 쪼개어 해결.
* **Convergence**: 값을 조금씩 수정하며 정답에 수렴함 (Gradient-Descent와 연결).
2. **왜 중요한가?**:
* 인간은 수백만 번의 반복에 지치지만, 컴퓨터는 지치지 않고 반복하여 압도적인 데이터 처리와 수치 해석을 수행하기 때문임. (Efficiency와 연결)
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 단순히 '횟수 반복 정책'에 그쳤으나, 현대 정책은 반복할 때마다 이전 결과를 학습에 반영하여 더 나아지는 '피드백 기반 반복 정책'으로 지능화됨(RL Update). (Feedback-Loops와 연결)
- **정책 변화(RL Update)**: 거대 모델의 추론 정책에서 한 번에 답을 내기보다, 여러 번의 생각(Iteration)을 거쳐 정답을 다듬는 '가챠(Sampling)와 재시도 정책'이 성능의 핵심 지표가 됨.
## 🔗 지식 연결 (Graph)
- [[Feedback-Loops|Feedback-Loops]], [[Gradient-Descent|Gradient-Descent]], [[Efficiency|Efficiency]], [[Incrementalism|Incrementalism]], [[Control-Theory|Control-Theory]]
- **Modern Tech/Tools**: For loops, Multi-pass reasoning, Iterative refinement, Self-correction loops.
---