32 lines
2.1 KiB
Markdown
32 lines
2.1 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-REAS-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.98
|
|
tags: [auto-reinforced, reasoning, deduction, induction, logical-thinking, intelligence]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Reasoning]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "생각의 고리 잇기: 단순히 외운 정보를 내뱉는 게 아니라, 알고 있는 사실들을 논리적으로 엮어(Chain) 결론에 도달하고, 한 번도 본 적 없는 낯선 문제 앞에서도 해결의 실마리를 찾아내는 '지능의 가동 엔진'."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
추론(Reasoning)은 이미 알고 있는 정보나 전제로부터 논리적 결론을 도출하는 과정입니다.
|
|
|
|
1. **3대 유형**:
|
|
* **Deduction (연역)**: 일반적 법칙에서 특수한 사례 도출 (100% 확실). (Logic와 연결)
|
|
* **Induction (귀납)**: 수많은 사례에서 일반적 법칙 발견 (확률적). (Probabilistic-Reasoning와 연결)
|
|
* **Abduction (가추)**: 결과에서 가장 그럴듯한 원인 추론 (가설 설정).
|
|
2. **왜 중요한가?**:
|
|
* 지식은 '재료'일 뿐이며, 이를 '요리'하여 답을 만드는 능력이 바로 추론이기 때문임. (Mastery로 가는 핵심 기술)
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 사람이 정의한 규칙(If-then) 정책 안에서만 움직였으나, 현대 정책은 AI가 "단계적으로 생각해보자"라는 지시를 통해 스스로 사고의 고리를 만드는 '자율적 추론(Chain-of-Thought) 정책'이 가능해짐(RL Update). (Prompt-Engineering와 연결)
|
|
- **정책 변화(RL Update)**: 단순히 다음 단어를 예측하는 정책을 넘어, 중간에 논리적 모순 정책이 있으면 스스로 멈추고 다시 생각하는 '추론형 모델(o1 등)'의 시대로 진화 중임.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Logic]], [[Probabilistic-Reasoning]], [[Mastery]], [[Prompt-Engineering]], [[Reflection]]
|
|
- **Modern Tech/Tools**: Chain-of-Thought (CoT), Tree-of-Thoughts (ToT), Logic solvers.
|
|
---
|