[G1-Sync] Manual knowledge update

2026-06-12 22:12:56 +09:00
parent 89fb05a28a
commit a4f58e0d9e
107 changed files with 7919 additions and 6 deletions
@@ -0,0 +1,59 @@
+---
+id: block-decomposition-method
+title: "Block Decomposition Method"
+category: "10_Wiki/Topics"
+status: "draft"
+verification_status: "conceptual"
+canonical_id: ""
+aliases: ["BDM"]
+duplicate_of: ""
+source_trust_level: "B"
+confidence_score: 0.85
+created_at: 2026-06-12
+updated_at: 2026-06-12
+review_reason: ""
+merge_history: []
+tags: ["research", "self envolving", "algorithmic-information-theory"]
+raw_sources: ["NotebookLM Synthesis"]
+applied_in: ["Algorithmic Information Dynamics (AID) Framework"]
+github_commit: ""
+---
+
+# [[Block Decomposition Method]]
+
+## 🎯 한 줄 통찰 (One-line insight)
+알고리즘 정보 이론을 바탕으로 대규모 데이터를 작은 블록으로 분해하여 각 블록의 로컬 생성 복잡도를 합산함으로써, 통계적 빈도를 넘어 시스템의 기저 생성 메커니즘을 정량화하는 고도화된 정보 측정 방법론이다 [1, 2].
+
+## 🧠 핵심 개념 (Core concepts)
+- **알고리즘 정보 이론(AIT):** 정보의 가치를 통계적 출현 빈도가 아닌, 해당 데이터를 생성하는 가장 짧은 프로그램의 길이(Kolmogorov 복잡도)로 정의한다 [1, 3].
+- **Coding Theorem Method (CTM):** 작은 튜링 기계들의 출력을 열거하여 특정 데이터가 생성될 알고리즘 확률($m$)을 추정하고, 이를 통해 복잡도($-log\,m$)를 도출하는 기법이다 [2, 4].
+- **블록 분해(Decomposition):** 계산 불가능한 Kolmogorov 복잡도를 근사하기 위해 대상 객체를 크기 $k$의 블록들로 나누어 개별 복잡도를 측정할 수 있도록 확장한다 [2, 5].
+- **다중성(Multiplicity) 반영:** 각 블록의 복잡도뿐만 아니라 해당 블록이 전체 데이터에서 반복되는 횟수($n_i$)의 로그값을 정보량에 포함하여 전체 시스템 복잡도를 산출한다 [2, 5].
+
+## 🧩 추출된 패턴 (Extracted patterns)
+- **확장성 확보 전략 (Scaling Strategy):** 단일 프로그램으로 표현하기 어려운 대규모 객체의 복잡도를 로컬 블록의 합으로 근사하여 계산적 한계를 극복하는 설계 패턴을 보인다 [2, 4].
+- **인과적 섭동 분석 (Causal Perturbation Analysis):** 시스템에 특정 섭동($\tau$)을 가하기 전후의 BDM 값 변화량($\Delta\tau$)을 측정하여, 각 요소가 시스템 전체의 인과적 구조에 기여하는 정도를 파악한다 [6, 7].
+- **이산적 닻(Symbolic Anchor):** 연속적인 파라미터 드리프트가 발생하는 통계적 모델과 달리, BDM을 기반으로 한 프로그램 표현은 이산적 특성을 가지므로 미세한 노이즈에도 구조적 일관성을 유지하는 '잠재적 장벽(Potential Barrier)' 역할을 수행한다 [8, 9].
+
+## 📖 세부 내용 (Details)
+- **BDM 수식 체계:** 객체 $o$에 대한 BDM 복잡도는 $BDM_k(o) = \sum_i (CTM(b_i) + \log n_i)$로 정의되며, 여기서 $b_i$는 크기 $k$의 블록, $n_i$는 해당 블록의 출현 빈도이다 [2, 5].
+- **통계적 추론의 한계 극복:** Shannon 엔트로피와 같은 통계적 지표는 데이터의 분포적 특성(Correlation)만을 다루지만, BDM은 기저의 생성 법칙(Causation)을 식별함으로써 데이터의 누락된 부분(Tails)까지도 논리적으로 유추할 수 있게 한다 [10-12].
+- **알고리즘 정보 역학(AID)과의 통합:** AID 프레임워크의 핵심 연산자로서, 시스템의 복잡도 변화를 실시간으로 추적하고 단순한 상관관계 분석을 넘어 기계적 일관성(Mechanistic Coherence)을 평가하는 도구로 활용된다 [11, 13, 14].
+- **자가 진화 시스템의 안정화:** LLM이 자가 생성 데이터로 재귀 훈련될 때 발생하는 '엔트로피 붕괴'와 '분산 증폭'을 억제하기 위해, 모델의 상태를 단순하고 강력한 알고리즘 설명(Minimal Program)에 고정시키는 역할을 수행한다 [15-18].
+
+## ⚖️ 모순 및 업데이트 (Contradictions & updates)
+- **통계적 손실 함수와의 대립:** 현재의 딥러닝(Transformer 등)에서 주로 사용되는 KL 발산 기반의 통계적 손실 함수는 메커니즘을 발견하지 못하고 분포 수렴(Collapse)을 초래하나, BDM 기반의 알고리즘 통합 방식은 이를 탈피할 수 있는 유일한 대안으로 제시된다 [11, 14, 19, 20].
+
+## 🛠️ 적용 사례 (Applied in summary)
+- **Algorithmic Information Dynamics (AID) 연산:** 시스템 전반의 인과적 경로를 식별하고 정보 흐름의 방향성을 정량화하는 데 BDM 연산자가 직접 적용된다 [5-7, 13].
+- **재귀적 자가 개선의 임계값 분석:** 시스템의 내부 복잡도 성장이 무한히 지속되기 위한 정보 통합 임계값($\Gamma$)을 수학적으로 증명하는 과정에서 복잡도 측정 척도로 사용된다 [21].
+- **Neurosymbolic 통합 가이드:** 통계적 학습기와 상징적 투영(Symbolic Projection)을 결합할 때, 모델이 알고리즘적으로 단순한 구조를 유지하도록 강제하는 수치적 제약 조건으로 제안된다 [9, 22-24].
+
+## ✅ 검증 상태 및 신뢰도
+- **상태:** draft
+- **검증 단계:** conceptual (알고리즘 정보 역학 및 모델 붕괴 이론의 핵심 수식으로 인용됨)
+- **출처 신뢰도:** B (연구 논문 및 수학적 정형화 문서 기반)
+- **중복 검사 결과:** 신규 생성 (New discovery)
+
+## 📝 변경 이력 (Change history)
+- 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine. (Source: "On the Limits of Self-Improving in Large Language Models")