Files
2nd/10_Wiki/Topics/AI/Iteration.md
T

2.0 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AUTO-ITER-001 10_Wiki/💡 Topics/AI 0.96
auto-reinforced
iteration
loops
recursion
computer-science
repetitive-tasks
2026-04-20

Iteration

📌 한 줄 통찰 (The Karpathy Summary)

"기능의 되풀이, 지능의 축적: 복잡한 작업을 단순한 작은 단계로 나누어 목표를 달성할 때까지 끈질기게 반복 실행함으로써, 단 한 번의 시도로는 불가능한 정교한 결과물을 빚어내는 컴퓨팅적 인내."

📖 구조화된 지식 (Synthesized Content)

반복(Iteration)은 동일한 절차를 여러 번 되풀이하는 컴퓨터 과학과 사고의 기본 원리입니다.

  1. 구현 방식:
    • Loops: 정해진 횟수(for)나 조건(while)이 만족될 때까지 코드 블록 실행.
    • Recursion: 함수가 자기 자신을 호출하여 문제를 작게 쪼개어 해결.
    • Convergence: 값을 조금씩 수정하며 정답에 수렴함 (Gradient-Descent와 연결).
  2. 왜 중요한가?:
    • 인간은 수백만 번의 반복에 지치지만, 컴퓨터는 지치지 않고 반복하여 압도적인 데이터 처리와 수치 해석을 수행하기 때문임. (Efficiency와 연결)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 단순히 '횟수 반복 정책'에 그쳤으나, 현대 정책은 반복할 때마다 이전 결과를 학습에 반영하여 더 나아지는 '피드백 기반 반복 정책'으로 지능화됨(RL Update). (Feedback-Loops와 연결)
  • 정책 변화(RL Update): 거대 모델의 추론 정책에서 한 번에 답을 내기보다, 여러 번의 생각(Iteration)을 거쳐 정답을 다듬는 '가챠(Sampling)와 재시도 정책'이 성능의 핵심 지표가 됨.

🔗 지식 연결 (Graph)