docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

This commit is contained in:
Antigravity Agent
2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
+6 -6
View File
@@ -1,12 +1,12 @@
---
id: [[P-Reinforce]]-AUTO-PRRE-001
id: [[P-Reinforce|P-Reinforce]]-AUTO-PRRE-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.94
tags: [auto-reinforced, probabilistic-[[Reasoning]], probability, uncertainty, bayesian, reasoning, [[Logic]]]
tags: [auto-reinforced, probabilistic-[[Reasoning|Reasoning]], probability, uncertainty, bayesian, reasoning, [[Logic|Logic]]]
last_reinforced: 2026-04-20
---
# [[Probabilistic-Reasoning]]
# [[Probabilistic-Reasoning|Probabilistic-Reasoning]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "0 아니면 1이 아닌 세상을 읽는 법: '이것은 분명히 참이다'라고 단언하는 대신, '이것이 참일 확률은 80%다'라고 정의하며 새로운 정보가 들어올 때마다 그 확률을 끊임없이 업데이트해 나가는 유연한 지성."
@@ -17,15 +17,15 @@ last_reinforced: 2026-04-20
1. **핵심 도구 (Bayesian Updating)**:
* **Prior**: 기존의 믿음.
* **Evidence**: 새로 발견된 증거.
* **Posterior**: 증거를 반영해 업데이트된 믿음. ([[MAP-Estimation]]와 연결)
* **Posterior**: 증거를 반영해 업데이트된 믿음. ([[MAP-Estimation|MAP-Estimation]]와 연결)
2. **왜 중요한가?**:
* 우리가 사는 현실은 정보가 항상 부족하고 노이즈가 섞여 있어(High uncertainty), 고전적 흑백논리로는 해결할 수 없는 문제가 많기 때문임. (Logic의 확장)
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 논리 규칙을 한 치의 오차 없이 지키는 정책(Deterministic)을 완벽한 지능이라 여겼으나, 현대 정책은 모호함 정책을 '확률'이라는 숫자로 품어내는 '부드러운 추론 정책'이 훨씬 더 복잡한 현실 정책을 잘 설명함이 입증됨(RL Update).
- **정책 변화(RL Update)**: 생성형 AI가 답변을 내놓는 과정 자체가 다음 단어가 뒤따라올 확률 정책을 계산하는 거대한 확률적 추론 정책이며, 이를 더 이성적으로 만들기 위해 '확률적 빔 서치'나 '최적 샘플링 정책' 등이 도입됨. ([[Large Language Models (LLM)]]와 연결)
- **정책 변화(RL Update)**: 생성형 AI가 답변을 내놓는 과정 자체가 다음 단어가 뒤따라올 확률 정책을 계산하는 거대한 확률적 추론 정책이며, 이를 더 이성적으로 만들기 위해 '확률적 빔 서치'나 '최적 샘플링 정책' 등이 도입됨. ([[Large Language Models (LLM)|Large Language Models (LLM)]]와 연결)
## 🔗 지식 연결 (Graph)
- [[Logic]], [[MAP-Estimation]], [[Large Language Models (LLM)]], [[Inexact-Science]], [[Judgment]]
- [[Logic|Logic]], [[MAP-Estimation|MAP-Estimation]], [[Large Language Models (LLM)|Large Language Models (LLM)]], [[Inexact-Science|Inexact-Science]], [[Judgment|Judgment]]
- **Modern Tech/Tools**: Bayesian networks, Hidden Markov Models, Probabilistic programming (Pyro, PyMC3).
---