[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-04-30 22:42:02 +09:00
parent 0bd4f19e38
commit c36c0644a1
4888 changed files with 18470 additions and 18602 deletions
+4 -4
View File
@@ -1,8 +1,8 @@
---
id: P-REINFORCE-AUTO-PRRE-001
id: [[P-Reinforce]]-AUTO-PRRE-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.94
tags: [auto-reinforced, probabilistic-reasoning, probability, uncertainty, bayesian, reasoning, logic]
tags: [auto-reinforced, probabilistic-[[Reasoning]], probability, uncertainty, bayesian, reasoning, [[Logic]]]
last_reinforced: 2026-04-20
---
@@ -17,13 +17,13 @@ last_reinforced: 2026-04-20
1. **핵심 도구 (Bayesian Updating)**:
* **Prior**: 기존의 믿음.
* **Evidence**: 새로 발견된 증거.
* **Posterior**: 증거를 반영해 업데이트된 믿음. (MAP-Estimation와 연결)
* **Posterior**: 증거를 반영해 업데이트된 믿음. ([[MAP-Estimation]]와 연결)
2. **왜 중요한가?**:
* 우리가 사는 현실은 정보가 항상 부족하고 노이즈가 섞여 있어(High uncertainty), 고전적 흑백논리로는 해결할 수 없는 문제가 많기 때문임. (Logic의 확장)
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 논리 규칙을 한 치의 오차 없이 지키는 정책(Deterministic)을 완벽한 지능이라 여겼으나, 현대 정책은 모호함 정책을 '확률'이라는 숫자로 품어내는 '부드러운 추론 정책'이 훨씬 더 복잡한 현실 정책을 잘 설명함이 입증됨(RL Update).
- **정책 변화(RL Update)**: 생성형 AI가 답변을 내놓는 과정 자체가 다음 단어가 뒤따라올 확률 정책을 계산하는 거대한 확률적 추론 정책이며, 이를 더 이성적으로 만들기 위해 '확률적 빔 서치'나 '최적 샘플링 정책' 등이 도입됨. (Large Language Models (LLM)와 연결)
- **정책 변화(RL Update)**: 생성형 AI가 답변을 내놓는 과정 자체가 다음 단어가 뒤따라올 확률 정책을 계산하는 거대한 확률적 추론 정책이며, 이를 더 이성적으로 만들기 위해 '확률적 빔 서치'나 '최적 샘플링 정책' 등이 도입됨. ([[Large Language Models (LLM)]]와 연결)
## 🔗 지식 연결 (Graph)
- [[Logic]], [[MAP-Estimation]], [[Large Language Models (LLM)]], [[Inexact-Science]], [[Judgment]]