--- id: P-REINFORCE-AUTO-FELP-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 0.95 tags: [auto-reinforced, feedback-loops, systems-thinking, cybernetics, self-correction, steering] last_reinforced: 2026-04-20 --- # [[Feedback-Loops|Feedback-Loops]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μ§€λŠ₯의 고리: ν–‰μœ„μ˜ κ²°κ³Όκ°€ λ‹€μ‹œ μ›μΈμ˜ μž…λ ₯으둜 λŒμ•„μ™€ μ‹œμŠ€ν…œμ„ κ°•ν™”ν•˜κ±°λ‚˜ μ•ˆμ •μ‹œν‚€λŠ” μˆœν™˜ ꡬ쑰둜, λͺ¨λ“  생λͺ…μ²΄μ˜ 항상성과 κΈ°κ³„μ˜ μžλ™ μ œμ–΄, 그리고 쑰직의 ν•™μŠ΅μ„ κ°€λŠ₯μΌ€ ν•˜λŠ” 우주의 운영 원리." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) ν”Όλ“œλ°± 루프(Feedback-Loops)λŠ” μ‹œμŠ€ν…œμ˜ 좜λ ₯이 μž…λ ₯을 μ‘°μ ˆν•˜λŠ” ν”„λ‘œμ„ΈμŠ€μž…λ‹ˆλ‹€. 1. **두 κ°€μ§€ μœ ν˜•**: * **Negative Feedback (μ•ˆμ •ν™”)**: λͺ©ν‘œμ™€ λ©€μ–΄μ§€λ©΄ λ°˜λŒ€ λ°©ν–₯으둜 νž˜μ„ κ°€ν•΄ ν˜„μž¬ μƒνƒœ μœ μ§€ (예: 에어컨 μ˜¨λ„ 쑰절, 인체 항상성). (Homeostasis와 μ—°κ²°) * **Positive Feedback (증폭)**: νŠΉμ • λ°©ν–₯으둜의 λ³€ν™”λ₯Ό 더 가속화 (예: μ‚°μšΈλ¦Ό ν˜„μƒ, 기술의 μ§€μˆ˜ μ„±μž₯, μ‹œμž₯ 독점). (Exponential-Growth와 μ—°κ²°) 2. **μ™œ μ€‘μš”ν•œκ°€?**: * μ‹œμŠ€ν…œμ΄ μ™ΈλΆ€ 변화에 μ μ‘ν•˜κ³  슀슀둜λ₯Ό 보정(Self-Correction)ν•˜κ²Œ λ§Œλ“œλŠ” 핡심 동λ ₯μž„. (Cybernetics의 κ·Όκ°„) ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±°μ—λŠ” ν”Όλ“œλ°±μ„ λ‹¨μˆœ 'κ²°κ³Ό 보고 μ •μ±…'으둜 λ³΄μ•˜μœΌλ‚˜, ν˜„λŒ€ 정책은 λ£¨ν”„μ˜ 속도와 정확도가 μ‹œμŠ€ν…œμ˜ μ§€λŠ₯ μ§€μˆ˜ 정책을 κ²°μ •ν•œλ‹€κ³  λ΄„(RL Update). - **μ •μ±… λ³€ν™”(RL Update)**: AI μ—μ΄μ „νŠΈ μ •μ±…μ—μ„œ '생각-μ‹€ν–‰-반영'의 ν”Όλ“œλ°± 루프인 ReAct νŒ¨ν„΄μ΄ λ„μž…λ˜λ©°, ν•œλ²ˆμ— 정닡을 λ‚΄λŠ” κ΅¬μ‘°μ—μ„œ 'κ³ μ³λ‚˜κ°€λŠ” μ§€λŠ₯ μ •μ±…'으둜 진화함. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Cybernetics|Cybernetics]], [[Control-Theory|Control-Theory]], [[Homeostasis (ᄒᅑᆼᄉᅑᆼᄉα…₯α†Ό)|Homeostasis (항상성)]], Self-Correction, [[Exponential-Growth|Exponential-Growth]] - **Modern Tech/Tools**: Monitoring dashboards, CI/CD pipelines, Reinforcement Learning agents. ---