2.2 KiB
2.2 KiB
id: P-Reinforce-AUTO-FELP-001 category: "10_Wiki/💡 Topics/AI" confidence_score: 0.95 tags: [auto-reinforced, feedback-loops, Systems-Thinking, Cybernetics, Self-Correction, steering] last_reinforced: 2026-04-20
Feedback-Loops
📌 한 줄 통찰 (The Karpathy Summary)
"지능의 고리: 행위의 결과가 다시 원인의 입력으로 돌아와 시스템을 강화하거나 안정시키는 순환 구조로, 모든 생명체의 항상성과 기계의 자동 제어, 그리고 조직의 학습을 가능케 하는 우주의 운영 원리."
📖 구조화된 지식 (Synthesized Content)
피드백 루프(Feedback-Loops)는 시스템의 출력이 입력을 조절하는 프로세스입니다.
- 두 가지 유형:
- Negative Feedback (안정화): 목표와 멀어지면 반대 방향으로 힘을 가해 현재 상태 유지 (예: 에어컨 온도 조절, 인체 항상성). (Homeostasis와 연결)
- Positive Feedback (증폭): 특정 방향으로의 변화를 더 가속화 (예: 산울림 현상, 기술의 지수 성장, 시장 독점). (Exponential-Growth와 연결)
- 왜 중요한가?:
- 시스템이 외부 변화에 적응하고 스스로를 보정(Self-Correction)하게 만드는 핵심 동력임. (Cybernetics의 근간)
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 과거에는 피드백을 단순 '결과 보고 정책'으로 보았으나, 현대 정책은 루프의 속도와 정확도가 시스템의 지능 지수 정책을 결정한다고 봄(RL Update).
- 정책 변화(RL Update): AI 에이전트 정책에서 '생각-실행-반영'의 피드백 루프인 ReAct 패턴이 도입되며, 한번에 정답을 내는 구조에서 '고쳐나가는 지능 정책'으로 진화함.
🔗 지식 연결 (Graph)
- Cybernetics, Control-Theory, Homeostasis (항상성), Self-Correction, Exponential-Growth
- Modern Tech/Tools: Monitoring dashboards, CI/CD pipelines, Reinforcement Learning agents.