Files
2nd/10_Wiki/Topics/Reasoning.md
T
2026-05-02 23:33:34 +09:00

2.2 KiB


id: P-Reinforce-AUTO-REAS-001 category: Unified confidence_score: 0.98 tags: [auto-reinforced, reasoning, deduction, induction, Logical-thinking, intelligence] last_reinforced: 2026-04-20

Reasoning

📌 한 줄 통찰 (The Karpathy Summary)

"생각의 고리 잇기: 단순히 외운 정보를 내뱉는 게 아니라, 알고 있는 사실들을 논리적으로 엮어(Chain) 결론에 도달하고, 한 번도 본 적 없는 낯선 문제 앞에서도 해결의 실마리를 찾아내는 '지능의 가동 엔진'."

📖 구조화된 지식 (Synthesized Content)

추론(Reasoning)은 이미 알고 있는 정보나 전제로부터 논리적 결론을 도출하는 과정입니다.

  1. 3대 유형:
    • Deduction (연역): 일반적 법칙에서 특수한 사례 도출 (100% 확실). (Logic와 연결)
    • Induction (귀납): 수많은 사례에서 일반적 법칙 발견 (확률적). (Probabilistic-Reasoning와 연결)
    • Abduction (가추): 결과에서 가장 그럴듯한 원인 추론 (가설 설정).
  2. 왜 중요한가?:
    • 지식은 '재료'일 뿐이며, 이를 '요리'하여 답을 만드는 능력이 바로 추론이기 때문임. (Mastery로 가는 핵심 기술)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 사람이 정의한 규칙(If-then) 정책 안에서만 움직였으나, 현대 정책은 AI가 "단계적으로 생각해보자"라는 지시를 통해 스스로 사고의 고리를 만드는 '자율적 추론(Chain-of-Thought) 정책'이 가능해짐(RL Update). (Prompt-Engineering와 연결)
  • 정책 변화(RL Update): 단순히 다음 단어를 예측하는 정책을 넘어, 중간에 논리적 모순 정책이 있으면 스스로 멈추고 다시 생각하는 '추론형 모델(o1 등)'의 시대로 진화 중임.

🔗 지식 연결 (Graph)