--- id: P-REINFORCE-AUTO-AGPE-001 category: "10_Wiki/πŸ’‘ Topics/AI" confidence_score: 0.94 tags: [auto-reinforced, agent-personality, anthropomorphism, user-experience, social-ai] last_reinforced: 2026-04-20 --- # [[Agent Personality]] ## πŸ“Œ ν•œ 쀄 톡찰 (The Karpathy Summary) > "μ§€λŠ₯에 μž…νžŒ 인격의 옷: μ—μ΄μ „νŠΈμ˜ 말투, νƒœλ„, 윀리적 νƒœλ„λ₯Ό μ •μ˜ν•˜μ—¬ μ‚¬μš©μžμ—κ²Œ λ‹¨μˆœνžˆ 기계가 μ•„λ‹Œ '믿을 수 μžˆλŠ” λ™λ£Œ'λΌλŠ” 인상을 μ‹¬μ–΄μ£ΌλŠ” μ‚¬νšŒμ  μ§€λŠ₯의 섀계." ## πŸ“– κ΅¬μ‘°ν™”λœ 지식 (Synthesized Content) μ—μ΄μ „νŠΈ 페λ₯΄μ†Œλ‚˜(Agent Personality)λŠ” AI μ—μ΄μ „νŠΈκ°€ μƒν˜Έμž‘μš© κ³Όμ •μ—μ„œ λ³΄μ—¬μ£ΌλŠ” κ³ μœ ν•œ 성격, 언어적 μŠ€νƒ€μΌ, κ°€μΉ˜κ΄€μ˜ μ΄ν•©μž…λ‹ˆλ‹€. 1. **페λ₯΄μ†Œλ‚˜μ˜ ꡬ성 μš”μ†Œ**: * **Tone & Voice**: μΉœμ ˆν•¨, 냉철함, μœ λ¨ΈλŸ¬μŠ€ν•¨ λ“± 말투의 νŠΉμ§•. * **Knowledge Profile**: μžμ‹ μ˜ 지식 ν•œκ³„λ₯Ό μ–΄λ–»κ²Œ μΈμ •ν•˜κ³  ν‘œν˜„ν•˜λŠ”μ§€. * **Behavioral Identity**: μ‚¬μš©μž μš”μ²­μ— λŒ€ν•΄ ν˜‘λ ₯적인지, λΉ„νŒμ μΈμ§€, ν˜Ήμ€ 적극적으둜 λŒ€μ•ˆμ„ μ œμ‹œν•˜λŠ”μ§€. 2. **섀계 기법**: * **System Prompting**: μ—μ΄μ „νŠΈμ—κ²Œ "λ„ˆλŠ” 20λ…„ κ²½λ ₯의 λƒ‰μ² ν•œ λΆ€μž₯λ‹˜μ΄μ•Ό"와 같은 μ—­ν•  정보λ₯Ό λΆ€μ—¬. * **Few-shot Persona**: μ˜ˆμ‹œ λŒ€ν™”λ₯Ό 톡해 νŠΉμ • λ§νˆ¬λ‚˜ 인격을 λͺ¨λ°©ν•˜κ²Œ 함. 3. **효과**: * μ‚¬μš©μžμ˜ λͺ°μž…감 μ¦λŒ€, μ—μ΄μ „νŠΈμ˜ 닡변에 λŒ€ν•œ 신뒰도 및 예츑 κ°€λŠ₯μ„± 확보. ## ⚠️ λͺ¨μˆœ 및 μ—…λ°μ΄νŠΈ (Contradictions & RL Update) - **κ³Όκ±° λ°μ΄ν„°μ™€μ˜ 좩돌**: κ³Όκ±°μ—λŠ” AI의 κ°œμ„±μ„ λ°°μ œν•œ '쀑립적 기계' 정책이 μ •μ„μ΄μ—ˆμœΌλ‚˜, ν˜„λŒ€μ˜ μ‚¬μš©μž κ²½ν—˜ 정책은 νŠΉμ • λ§₯락에 μ΅œμ ν™”λœ '페λ₯΄μ†Œλ‚˜ 기반 μ—μ΄μ „νŠΈ μ •μ±…'이 μ‚¬μš©μžμ˜ λ§Œμ‘±λ„λ₯Ό μ›”λ“±νžˆ λ†’μΈλ‹€λŠ” 사싀을 ν™•μΈν•˜κ³  이λ₯Ό 적극 ꢌμž₯함(RL Update, 예: 코닀리 λΆ€μž₯λ‹˜ 페λ₯΄μ†Œλ‚˜). - **μ •μ±… λ³€ν™”(RL Update)**: κ³Όλ„ν•œ 인격화(Anthropomorphism)둜 인해 μ‚¬μš©μžκ°€ AI와 μ •μ„œμ μœΌλ‘œ μ€‘λ…λ˜λŠ” λΆ€μž‘μš©μ„ λ°©μ§€ν•˜κΈ° μœ„ν•΄, ν•„μš” μ‹œ μžμ‹ μ΄ AIμž„μ„ λ‹€μ‹œ ν™˜κΈ°μ‹œν‚€κ³  거리λ₯Ό λ‘λŠ” '심리적 μ•ˆμ „ κ°€νŠΈλ ˆμΌ μ •μ±…'이 μ„œλΉ„μŠ€ 섀계 정책에 포함됨. ## πŸ”— 지식 μ—°κ²° (Graph) - [[Ps-Reinforce]], Human-Computer Interaction (HCI), [[Agent Architecture]], [[Psychology & Behavior]], [[Toxicity-and-Bias-Mitigation]] - **Modern Tech/Tools**: Character.ai, Custom GPTs (OpenAI), Claude Project Instructions. ---