bluemsi/2nd

Files

T

bluemsi 6b86b0da4c feat: complete wikification of War Commander batch 1&2 and final grey dot cleanup

2026-04-27 18:58:22 +09:00

2.0 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AUTO-ITER-001

10_Wiki/💡 Topics/AI

0.96

auto-reinforced

iteration

loops

recursion

computer-science

repetitive-tasks

2026-04-20

Iteration

📌 한 줄 통찰 (The Karpathy Summary)

"기능의 되풀이, 지능의 축적: 복잡한 작업을 단순한 작은 단계로 나누어 목표를 달성할 때까지 끈질기게 반복 실행함으로써, 단 한 번의 시도로는 불가능한 정교한 결과물을 빚어내는 컴퓨팅적 인내."

📖 구조화된 지식 (Synthesized Content)

반복(Iteration)은 동일한 절차를 여러 번 되풀이하는 컴퓨터 과학과 사고의 기본 원리입니다.

구현 방식:
- Loops: 정해진 횟수(for)나 조건(while)이 만족될 때까지 코드 블록 실행.
- Recursion: 함수가 자기 자신을 호출하여 문제를 작게 쪼개어 해결.
- Convergence: 값을 조금씩 수정하며 정답에 수렴함 (Gradient-Descent와 연결).
왜 중요한가?:
- 인간은 수백만 번의 반복에 지치지만, 컴퓨터는 지치지 않고 반복하여 압도적인 데이터 처리와 수치 해석을 수행하기 때문임. (Efficiency와 연결)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 과거에는 단순히 '횟수 반복 정책'에 그쳤으나, 현대 정책은 반복할 때마다 이전 결과를 학습에 반영하여 더 나아지는 '피드백 기반 반복 정책'으로 지능화됨(RL Update). (Feedback-Loops와 연결)
정책 변화(RL Update): 거대 모델의 추론 정책에서 한 번에 답을 내기보다, 여러 번의 생각(Iteration)을 거쳐 정답을 다듬는 '가챠(Sampling)와 재시도 정책'이 성능의 핵심 지표가 됨.

🔗 지식 연결 (Graph)

Feedback-Loops, Gradient-Descent, Efficiency, Incrementalism, Control-Theory
Modern Tech/Tools: For loops, Multi-pass reasoning, Iterative refinement, Self-correction loops.