[P-Reinforce] Substantial content added to BDNF/Bellman/Branded/Bayes/B-Tree (Batch 02)

This commit is contained in:
2026-04-20 16:57:29 +09:00
parent f47e3a1186
commit 51e9e10b5a
6 changed files with 87 additions and 56 deletions
+15 -15
View File
@@ -1,29 +1,29 @@
---
id: P-REINFORCE-AI-BAYES
id: P-REINFORCE-AI-BAYESIAN
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.99
tags: [Bayesian Inference, Probability, Thinking, Logic]
confidence_score: 0.98
tags: [Bayesian Inference, Probability, Stats, AI]
last_reinforced: 2026-04-20
---
# [[Bayesian-Inference]] (베이지안 추론)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 세상은 확실한 답변(P=0 or 1)이 아니라 '확률적 믿음'으로 가득 차 있으며, 새로운 증거가 나타날 때마다 그 믿음의 확률을 끊임없이 수정(Update)하는 것이 진정한 지능이다.
> "믿음은 고정된 것이 아니라 정보에 따라 진화한다." 기존의 배경 지식(Prior)에 새로운 근거(Evidence)를 더해 더 정확한 진실(Posterior)에 다가가는 통계학적 통찰이다.
## 📖 구조화된 지식 (Synthesized Content)
- **Prior, Likelihood, Posterior**:
- **Prior (사전 확률)**: 사건이 발생하기 전의 나의 믿음.
- **Likelihood (우도)**: 만약 내 믿음이 맞다면 이번 결과가 나올 확률.
- **Posterior (사후 확률)**: 결과를 목격하고 난 뒤 수정된 새로운 믿음.
- **베이즈 정리 ($P(A|B) = P(B|A)P(A) / P(B)$)**:
- 관측되지 않은 원인(A)의 확률을 관측된 결과(B)를 통해 추론하는 강력한 수학적 도구.
- **Applications in AI**:
- 스팸 메일 분류(Naive Bayes), 자율주행 센서 퓨전(Kalman Filter), 강화학습의 탐험(Exploration vs Exploitation) 전략의 근간이다.
- **Prior Probability (사전 확률)**:
- 새로운 데이터를 보기 전에 우리가 이미 알고 있는 지식이나 가설의 확률.
- **Likelihood (우도)**:
- 어떤 가설이 참일 때, 현재 관찰된 데이터가 나타날 확률.
- **Posterior Probability (사후 확률)**:
- 새로운 데이터를 반영한 후 업데이트된 우리의 최종 믿음.
- **Application**:
- 스팸 메일 필터링, 의료 진단, 자율주행 차의 센서 융합 등 불확실성이 큰 환경의 의사결정에 필수적이다.
## ⚠️ 모순 및 업데이트 (RL Update)
- 전통 통계학(Frequentist)과의 차이점을 이해해야 한다. 베이지안은 '모르는 것'에 대한 주관적 가정을 허용하므로, 데이터가 적은 초기 단계에서 훨씬 강력하지만 부적절한 사전 확률(Prior) 설정은 편향된 결과를 낳을 수 있다.
- 베이지안 추론은 '사전 확률'을 설정할 때 주관이 개입된다는 비판을 받기도 한다(빈도주의 통계학과의 논쟁). 하지만 데이터가 적은 초기 상태에서는 베이지만큼 강력한 예측 도구가 없다.
## 🔗 지식 연결 (Graph)
- Related: [[Information Theory]] , [[Common_Sense_Reasoning]]
- Foundation: [[Computational Thinking]]
- Related: [[Automated-Reasoning]] , [[Behavioral-Economics]]
- Foundation: [[Computational Theory & Math/Information Theory]]