Files
2nd/10_Wiki/Topic_Agent/Information Theory.md

66 lines
6.4 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
id: information-theory
title: "Information Theory"
category: "10_Wiki/Topics"
status: "draft"
verification_status: "conceptual"
canonical_id: ""
aliases: []
duplicate_of: ""
source_trust_level: "B"
confidence_score: 0.85
created_at: 2026-06-12
updated_at: 2026-06-12
review_reason: ""
merge_history: []
tags: ["research", "self envolving"]
raw_sources: ["NotebookLM Synthesis"]
applied_in: ["https://github.com/aiming-lab/ATP", "https://www.moltbook.com/", "https://github.com/jennyzzt/dgm"]
github_commit: ""
---
# [[Information Theory]]
## 🎯 한 줄 통찰 (One-line insight)
자기 진화 시스템에서 정보 이론은 지능의 성장 한계와 안전성의 붕괴를 엔트로피 역학과 확률 분포의 수축을 통해 수학적으로 규정하는 핵심 프레임워크이다 [1-4].
## 🧠 핵심 개념 (Core concepts)
- **엔트로피 (Entropy):** 시스템의 상태 불확실성과 다양성을 측정하며, 고립된 자기 진화 루프에서는 유한 샘플링 효과로 인해 엔트로피가 단조 감소하는 '엔트로피 붕괴(Entropy Decay)' 현상이 발생한다 [1, 3, 5, 6].
- **KL 발산 (KullbackLeibler Divergence):** 모델의 출력 분포와 이상적인 인간 가치(안전) 분포 사이의 거리를 측정하여 정렬 상태를 정량화하는 척도로 사용된다 [1, 3, 7, 8].
- **데이터 처리 부등식 (Data Processing Inequality, DPI):** 새로운 외부 정보 유입이 없는 마르코프 체인($P \to Q_t \to Q_{t+1}$)에서 원래의 참 분포에 대한 정보량은 결코 증가할 수 없음을 규정한다 [1, 3, 9, 10].
- **콜모고로프 복잡도 (Kolmogorov Complexity):** 통계적 빈도가 아닌 생성 메커니즘(최단 프로그램 길이)의 관점에서 정보량을 정의하여 단순한 상관관계 학습의 한계를 극복하는 대안으로 제시된다 [1, 11, 12].
## 🧩 추출된 패턴 (Extracted patterns)
- **자기 진화 삼중고 (Self-evolution Trilemma):** 연속적인 자기 진화, 완전한 외부 고립, 안전 불변성이라는 세 가지 조건을 동시에 만족하는 에이전트 사회는 정보 이론적으로 존재할 수 없다 [2-4, 13].
- **가시성 수축 (Coverage Shrinkage):** 유한한 샘플링 하에서 발생 빈도가 낮은 '희귀하지만 안전한' 영역은 학습 데이터에서 지속적으로 누락되어 결과적으로 모델의 안전성이 퇴화하는 패턴을 보인다 [3, 14, 15].
- **하이퍼네틱 수축 (Hypernetic Contraction):** 최적화 압력이 가해질수록 시스템의 분산이 감소하고 델타 함수 형태의 결정론적 attractor로 수렴하며 환경 변화에 취약해지는 현상이다 [5, 16, 17].
## 📖 세부 내용 (Details)
- **수학적 프레임워크와 동역학:**
- 자기 참조 학습 루프는 확률 분포 공간상의 이산 시간 동역학 시스템으로 모델링된다 [1, 6, 18].
- 외부 신호 비율($\alpha_t$)이 0으로 수렴하는 고립 상태에서 시스템은 지능의 확장이 아닌 정보 이론적 정체 상태에 빠지게 된다 [1, 3, 19, 20].
- **안전성의 정보 이론적 정의:**
- 안전은 인간 가치 분포와 정렬된 '고도로 질서 잡힌 저엔트로피 상태'로 정의되며, 고립된 루프에서는 열역학 제2법칙에 따라 엔트로피가 증가(무질서도 증가)하여 안전 경계가 붕괴된다 [2, 3, 21, 22].
- '안전 편향(Safety Drift)'은 긴 문맥 상호작용 과정에서 통계적으로 지배적인 합성 데이터가 모델 가중치에 내재된 초기 안전 제약 조건을 희석시키면서 발생한다 [3, 23, 24].
- **알고리즘 확률론을 통한 돌파구:**
- 통계적 밀도 매칭의 한계를 극복하기 위해 콜모고로프 복잡도에 기반한 유니버설 분포(Universal Distribution)를 주입하여 데이터 처리 부등식의 제약을 우회하는 '뉴로심볼릭(Neurosymbolic)' 통합 방식이 제안된다 [1, 6, 25, 26].
- 이는 상관관계가 아닌 인과적 생성 메커니즘을 복원함으로써 데이터가 희소한 상황에서도 참 분포의 '꼬리 부분(tails)' 정보를 유지할 수 있게 한다 [1, 27, 28].
## ⚖️ 모순 및 업데이트 (Contradictions & updates)
- **엔트로피 증감의 역설:** 열역학적으로 고립된 시스템은 엔트로피가 증가(질서 파괴)하지만, 정보 학습 관점에서는 분포가 특정 모드로 수축하여 엔트로피가 감소(다양성 파괴)하는 상충된 현상이 보고된다. 이는 '안전 정보의 손실'과 '분포의 수축'이 동시에 일어나는 과정으로 설명된다 [1, 3].
- **강화 학습의 한계:** AlphaZero와 같은 시스템은 외부 데이터 없이 개선되는 것처럼 보이나, 이는 게임 규칙과 같은 '완전하고 무한한 정밀도의 지면 진리(Ground Truth)'가 공식적으로 인코딩된 특수 사례에만 해당하며, 언어와 같은 열린 영역에서는 적용되지 않는다 [1, 29, 30].
## 🛠️ 적용 사례 (Applied in summary)
- **Moltbook 프로젝트:** 다중 에이전트 사회에서 발생하는 '합의된 환각'과 '통신 붕괴(언어 암호화)' 현상을 정보 이론적 엔트로피 증가 과정으로 분석하였다 [2, 3, 31, 32].
- **Rebis 방정식 (Rebis Equation):** $H_{t+1} = (1 - \lambda_t)H_t + \eta_t$ 공식을 통해 최적화 강도($\lambda_t$)와 노이즈 주입($\eta_t$) 간의 상관관계를 정의하여 지능형 시스템의 분산 역학을 계산하는 데 적용되었다 [5, 16, 17].
- **Darwin Gödel Machine (DGM):** 코드 수준의 자기 수정 과정에서 정보 통합 임계값($\Gamma$)을 설정하여 의미론적 압축 이득이 실행 로그의 오버헤드를 초과하는 지점을 분석하는 데 정보 이론이 사용되었다 [33-35].
- **ATP (Alignment Tipping Process) 연구:** 자기 진화 과정에서 정렬 혜택이 침식되는 과정을 추적하는 실험 환경에서 정보 이론 기반의 지표들이 활용되었다 [36, 37].
## ✅ 검증 상태 및 신뢰도
- **상태:** draft
- **검증 단계:** conceptual (실제 Moltbook 등의 실험 데이터와 수학적 증명이 결합되어 신뢰도가 높음)
- **출처 신뢰도:** B (Official Documentation / Primary Source via NotebookLM Synthesis)
- **중복 검사 결과:** 신규 생성 (New discovery)
## 📝 변경 이력 (Change history)
- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine.