--- id: wiki-2026-0508-operant-conditioning title: Operant Conditioning category: 10_Wiki/Topics status: needs_review canonical_id: self aliases: [P-Reinforce-PSYCH-004] duplicate_of: none source_trust_level: A confidence_score: 0.94 tags: [Psychology, Behavior, conditioning, skinner] raw_sources: [] last_reinforced: 2026-04-20 github_commit: batch-reinforce-03 inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08) tech_stack: language: unspecified framework: unspecified --- # [[Opera]]nt Conditioning ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > ν–‰λ™μ˜ κ²°κ³Όκ°€ 미래의 행동 λΉˆλ„λ₯Ό κ²°μ •ν•œλ‹€λŠ” 원리λ₯Ό 톡해 생λͺ…μ²΄μ˜ 적응적 행동 λ³€ν™”λ₯Ό μ„€λͺ…ν•˜λŠ” 고전적 λ©”μΉ΄λ‹ˆμ¦˜. ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) - **μΆ”μΆœλœ νŒ¨ν„΄:** 정적/뢀적 κ°•ν™”(Reinforcement)와 처벌(Punishment)의 쑰합을 톡해 행동을 μ‘°ν˜•(Shaping)ν•˜λŠ” ν™˜κ²½ ν†΅μ œ νŒ¨ν„΄. - **μ„ΈλΆ€ λ‚΄μš©:** - μŠ€ν‚€λ„ˆ λ°•μŠ€ μ‹€ν—˜μ„ ν†΅ν•œ 행동 λΆ„μ„μ˜ 기초 확립. - 간헐적 κ°•ν™” μŠ€μΌ€μ€„μ΄ ν–‰λ™μ˜ μœ μ§€μ™€ μ†Œκ±°μ— λ―ΈμΉ˜λŠ” 영ν–₯. - ν˜„λŒ€ μ§€λŠ₯ν˜• μ—μ΄μ „νŠΈμ˜ κ°•ν™”ν•™μŠ΅(RL) μ•Œκ³ λ¦¬μ¦˜μ˜ 심리학적 기원. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & Updates) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌:** ν–‰λ™μ˜ 외적 κ²°κ³Όμ—λ§Œ μ§‘μ€‘ν•˜λ˜ ν–‰λ™μ£Όμ˜μ—μ„œ, 내적 인지 과정을 ν¬ν•¨ν•œ 인지 행동 λͺ¨λΈλ‘œ ν™•μž₯. - **μ •μ±… λ³€ν™”:** μ‚¬μš©μž κ²½ν—˜(UX) 섀계(w3) μ‹œ '보상 μŠ€μΌ€μ€„'의 윀리적 적용 κ°€μ΄λ˜μŠ€ κ°•ν™”. ## πŸ”— 지식 μ—°κ²° (Graph) - **Parent:** [[10_Wiki/πŸ’‘ Topics/Psychology]] - **Related:** [[ABA]], [[Behavioral-Economics]], [[Reinforcement-Learning]] - **Raw Source:** 00_Raw/2026-04-20/[[Operant Conditioning]].md ## πŸ€– LLM ν™œμš© 힌트 (How to Use This Knowledge) **μ–Έμ œ 이 지식을 μ“°λŠ”κ°€:** - *(TODO)* **μ–Έμ œ μ“°λ©΄ μ•ˆ λ˜λŠ”κ°€:** - *(TODO)* ## πŸ§ͺ 검증 μƒνƒœ (Validation) - **정보 μƒνƒœ:** needs_review - **좜처 신뒰도:** A - **κ²€ν†  이유:** *(P-Reinforce Phase 1 μžλ™ μ •κ·œν™”. λ³Έλ¬Έ 검증 ν•„μš”.)* ## 🧬 쀑볡 검사 (Duplicate Check) - **κΈ°μ‘΄ μœ μ‚¬ λ¬Έμ„œ:** *(TODO: μΈλ±μ„œ ν΄λŸ¬μŠ€ν„° 리포트 μ°Έμ‘°)* - **처리 방식:** UPDATE (μžλ™ μ •κ·œν™”) - **처리 이유:** Phase 1 μ •κ·œν™” β€” μ˜› ν…œν”Œλ¦Ώ/λˆ„λ½ ν•„λ“œ 보강. ## πŸ•“ λ³€κ²½ 이λ ₯ (Changelog) | λ‚ μ§œ | λ³€κ²½ λ‚΄μš© | 처리 방식 | 신뒰도 | |------|-----------|-----------|--------| | 2026-05-08 | P-Reinforce Phase 1 μ •κ·œν™” (frontmatter + 헀더 ν‘œμ€€ν™”) | UPDATE | A | ## πŸ’» μ½”λ“œ νŒ¨ν„΄ (Code Patterns) **νŒ¨ν„΄ 1:** *(TODO: 이 ν”„λ‘œμ νŠΈ μ»¨λ²€μ…˜ λ°˜μ˜ν•œ ꡬ쑰 μŠ€μΌˆλ ˆν†€)* ```text # TODO ``` ## πŸ€” μ˜μ‚¬κ²°μ • κΈ°μ€€ (Decision Criteria) **선택 Aλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **선택 Bλ₯Ό 써야 ν•  λ•Œ:** - *(TODO)* **κΈ°λ³Έκ°’:** > *(TODO)* ## ❌ μ•ˆν‹°νŒ¨ν„΄ (Anti-Patterns) - **[μ•ˆν‹°νŒ¨ν„΄]:** *(TODO: 무엇을 ν•˜λ©΄ μ•ˆ λ˜λŠ”κ°€ + 이유 + λŒ€μ‹  무엇을)*