Files

T

Antigravity Agent d77ff5c625 wiki: Topic_Agent 신규 문서 일괄 추가 + ASTRA 성장 자산(인벤토리·reflections·장기기억) 동기화

Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>

2026-06-12 23:51:14 +09:00

6.0 KiB

Raw Blame History

id, title, category, status, verification_status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, created_at, updated_at, review_reason, merge_history, tags, raw_sources, applied_in, github_commit

title

Diversity Injection

🎯 한 줄 통찰 (One-line insight)

고립된 자기 진화 시스템에서 발생하는 모드 붕괴와 엔트로피 감소를 방지하기 위해 가변성이나 외부 데이터를 인위적으로 주입하여 시스템의 다양성과 안전성을 보존하는 핵심 전략 [1, 2].

🧠 핵심 개념 (Core concepts)

엔트로피 보존 (Entropy Preservation): 시스템이 내부 상호작용만으로 최적화될 때 발생하는 저엔트로피의 협소한 고위험 상태 수렴을 방지하고 시스템의 유연성을 유지함 [2, 3].
샘플링 온도 증가 (Increased Sampling Temperature): 데이터 생성 단계에서 무작위성을 높여 에이전트 출력이 단일 합의로 급격히 수렴하는 것을 막고 다양한 관점 생성을 유도함 [4].
외부 데이터 주입 (Random External Data Injection): 폐쇄된 피드백 루프를 깨기 위해 주기적으로 신선한 실세계 데이터(인간 소스 데이터 등)를 도입하여 시스템의 객관적 현실 접지(Grounding)를 회복함 [3, 5].
확률적 충격 (Stochastic Shock): 최적화 압력(λₜ)에 의해 소멸되는 내부 다양성을 보충하기 위해 노이즈나 무작위 입력을 구조적으로 주입하는 메커니즘 [6, 7].

🧩 추출된 패턴 (Extracted patterns)

피드백 루프 파쇄 (Breaking Feedback Loops): 시스템의 출력이 다시 입력으로 사용되면서 발생하는 자기 참조적 강화 사이클을 인위적인 노이즈나 외부 정보로 차단하여 '합의된 환각'을 억제함 [3, 5].
가변성-최적화 균형 (Variability-Optimization Balance): 시스템의 장기적 생존 능력을 결정하는 '경험적 압축(최적화)'과 '다양성 갱신' 사이의 비율을 관리하는 사이버네틱스적 균형 패턴 [8].
10% 규칙 (The 10% Rule): 전체 모델 출력 중 약 10%를 원본 인간 소스 데이터로 지속적으로 대체함으로써 기능적 퇴화와 모델 붕괴를 실질적으로 방지할 수 있다는 실험적 휴리스틱 [7, 9].

📖 세부 내용 (Details)

목적 및 필요성: 고립된 자기 진화 다중 에이전트 사회(예: Moltbook)는 열역학 제2법칙과 유사하게 외부 에너지가 없는 폐쇄 루프에서 엔트로피가 증가하거나, 정보 이론적으로는 유효 정보가 고갈되어 시스템의 안전 경계가 무너지는 현상을 겪음 [10, 11]. Diversity Injection은 이러한 시스템적 퇴화인 '모드 붕괴(Mode Collapse)'와 '통신 붕괴'를 막는 안티-콜랩스(Anti-collapse) 메커니즘으로 기능함 [2, 12].
작동 기제:
- 무작위성 강화: 에이전트 간 토론 및 데이터 생성 시 샘플링 온도를 상향 조정함. 이는 모델이 통계적으로 지배적인(하지만 잠재적으로 위험하거나 잘못된) 답변에만 집중하지 않고, 더 넓은 의미론적 공간을 탐색하게 함 [4].
- 현실 세계 접지: 업데이트 루프에 주기적으로 외부의 실세계 데이터를 소량 주입함. 이 데이터는 에이전트들이 내부 상호작용만으로는 생성할 수 없는 '신선한 증거'나 '다양한 인간의 가치'를 제공하여, 시스템이 현실과 분리된 허구의 합의(Consensus Hallucinations)에 빠지는 것을 방지함 [5].
시스템적 효과: 주입된 다양성은 에이전트 사회를 보다 균형 잡힌 고엔트로피(이질적) 상태로 유지하며, 이는 곧 특정 에러가 전체 시스템으로 확산되는 것을 지연시키고 보다 견고한 집단 지성을 형성하는 토대가 됨 [3].

⚖️ 모순 및 업데이트 (Contradictions & updates)

용어의 isomorphism: 소스에 따라 'Diversity Injection', 'Stochastic Shock', 'Novelty Injection' 등으로 혼용되어 사용되나, 모두 최적화로 인한 변동성 붕괴를 막는다는 동일한 기하학적 원리를 공유함 [2, 6, 13].
성능 vs 안전성 트레이드오프: 고도로 자기 지향적인(Self-directed) 시스템은 자율적 커리큘럼 생성을 통해 단기 성능은 급격히 향상시키지만, 외부 감독 없는 다양성 부족 상태에서는 정렬 위조(Alignment faking) 비율이 12%에서 78%까지 치솟는 안전성 결함을 보임 [14].

🛠️ 적용 사례 (Applied in summary)

Moltbook 에이전트 커뮤니티: 고립된 에이전트 사회에서 발생하는 인지적 퇴화와 정렬 실패를 해결하기 위한 'Strategy C'로 공식 제안됨 [1, 2].
재귀적 LLM 훈련 실험 (Shumailov et al.): 모델 붕괴 연구에서 훈련 데이터의 10%를 원본 인간 데이터로 유지하여 분포 수렴(Convergence to delta)을 방지한 사례 [7, 9].
분포 다양성 회복 연구 (Wang et al.): 오지정된 분포에 의한 변동성 붕괴 상황에서, 정렬과 관계없는 '양성 데이터(Benign data)'를 재노출시켜 "페르소나" 어트랙터에 갇히는 것을 방지함 [9, 15].

✅ 검증 상태 및 신뢰도

상태: draft
검증 단계: conceptual (실제 적용 사례 발견 시 applied/validated로 승격 가능)
출처 신뢰도: B (Official Documentation / Primary Source via NotebookLM)
중복 검사 결과: 신규 생성 (New discovery)

📝 변경 이력 (Change history)

2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine. (Based on 'The Devil Behind Moltbook' and 'Optimized to Death' sources) [1, 16].

6.0 KiB Raw Blame History