Files
2nd/10_Wiki/Topics/Probabilistic-Reasoning.md
T

2.2 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AUTO-PRRE-001 10_Wiki/💡 Topics/AI 0.94
auto-reinforced
probabilistic-reasoning
probability
uncertainty
bayesian
reasoning
logic
2026-04-20

Probabilistic-Reasoning

📌 한 줄 통찰 (The Karpathy Summary)

"0 아니면 1이 아닌 세상을 읽는 법: '이것은 분명히 참이다'라고 단언하는 대신, '이것이 참일 확률은 80%다'라고 정의하며 새로운 정보가 들어올 때마다 그 확률을 끊임없이 업데이트해 나가는 유연한 지성."

📖 구조화된 지식 (Synthesized Content)

확률적 추론(Probabilistic-Reasoning)은 불확실한 지식을 다루기 위해 확률론적 방법을 사용하는 추론 기법입니다.

  1. 핵심 도구 (Bayesian Updating):
    • Prior: 기존의 믿음.
    • Evidence: 새로 발견된 증거.
    • Posterior: 증거를 반영해 업데이트된 믿음. (MAP-Estimation와 연결)
  2. 왜 중요한가?:
    • 우리가 사는 현실은 정보가 항상 부족하고 노이즈가 섞여 있어(High uncertainty), 고전적 흑백논리로는 해결할 수 없는 문제가 많기 때문임. (Logic의 확장)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 논리 규칙을 한 치의 오차 없이 지키는 정책(Deterministic)을 완벽한 지능이라 여겼으나, 현대 정책은 모호함 정책을 '확률'이라는 숫자로 품어내는 '부드러운 추론 정책'이 훨씬 더 복잡한 현실 정책을 잘 설명함이 입증됨(RL Update).
  • 정책 변화(RL Update): 생성형 AI가 답변을 내놓는 과정 자체가 다음 단어가 뒤따라올 확률 정책을 계산하는 거대한 확률적 추론 정책이며, 이를 더 이성적으로 만들기 위해 '확률적 빔 서치'나 '최적 샘플링 정책' 등이 도입됨. (Large Language Models (LLM)와 연결)

🔗 지식 연결 (Graph)