bluemsi/2nd

Files

T

koriweb 3d9d0077cc feat: organize and categorize 1535 knowledge assets into wiki topics (2026-04-29)

2026-04-29 18:14:09 +09:00

2.2 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AUTO-PRRE-001

10_Wiki/💡 Topics/AI

0.94

auto-reinforced

probabilistic-reasoning

probability

uncertainty

bayesian

reasoning

logic

2026-04-20

Probabilistic-Reasoning

📌 한 줄 통찰 (The Karpathy Summary)

"0 아니면 1이 아닌 세상을 읽는 법: '이것은 분명히 참이다'라고 단언하는 대신, '이것이 참일 확률은 80%다'라고 정의하며 새로운 정보가 들어올 때마다 그 확률을 끊임없이 업데이트해 나가는 유연한 지성."

📖 구조화된 지식 (Synthesized Content)

확률적 추론(Probabilistic-Reasoning)은 불확실한 지식을 다루기 위해 확률론적 방법을 사용하는 추론 기법입니다.

핵심 도구 (Bayesian Updating):
- Prior: 기존의 믿음.
- Evidence: 새로 발견된 증거.
- Posterior: 증거를 반영해 업데이트된 믿음. (MAP-Estimation와 연결)
왜 중요한가?:
- 우리가 사는 현실은 정보가 항상 부족하고 노이즈가 섞여 있어(High uncertainty), 고전적 흑백논리로는 해결할 수 없는 문제가 많기 때문임. (Logic의 확장)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 과거에는 논리 규칙을 한 치의 오차 없이 지키는 정책(Deterministic)을 완벽한 지능이라 여겼으나, 현대 정책은 모호함 정책을 '확률'이라는 숫자로 품어내는 '부드러운 추론 정책'이 훨씬 더 복잡한 현실 정책을 잘 설명함이 입증됨(RL Update).
정책 변화(RL Update): 생성형 AI가 답변을 내놓는 과정 자체가 다음 단어가 뒤따라올 확률 정책을 계산하는 거대한 확률적 추론 정책이며, 이를 더 이성적으로 만들기 위해 '확률적 빔 서치'나 '최적 샘플링 정책' 등이 도입됨. (Large Language Models (LLM)와 연결)

🔗 지식 연결 (Graph)

Logic, MAP-Estimation, Large Language Models (LLM), Inexact-Science, Judgment
Modern Tech/Tools: Bayesian networks, Hidden Markov Models, Probabilistic programming (Pyro, PyMC3).