34 lines
2.6 KiB
Markdown
34 lines
2.6 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-ZSCOT-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.98
|
|
tags: [auto-reinforced, zero-shot-cot, chain-of-thought, reasoning, prompting, llm]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Zero-Shot-Chain-of-Thought|Zero-Shot-Chain-of-Thought]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "마법의 주문 '차근차근 생각해보자': 복잡한 문제에 대해 결과를 바로 묻지 않고 생각의 과정을 요구함으로써, AI의 논리 회로를 강제로 활성화해 정답률을 드라마틱하게 높이는 추론 최적화 기폭제."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
제로샷 연쇄 사고(Zero-Shot Chain-of-Thought, Zero-Shot-CoT)는 2022년 Kojima 등이 제안한 기법으로, 프롬프트 끝에 특정 문구를 덧붙이는 것만으로 LLM의 다단계 추론 능력을 이끌어내는 매우 단순하면서도 강력한 프롬프트 엔지니어링 기술입니다.
|
|
|
|
1. **핵심 트리거 문구**:
|
|
* **"Let's think step by step (차근차근 단계별로 생각해보자)"**
|
|
2. **작동 원리**:
|
|
* 이 문구는 모델이 다음에 올 토큰을 생성할 때, '최종 정답' 대신 '중간 추론 과정'을 먼저 생성하게 유도함.
|
|
* 모델은 자신이 앞서 생성한 추론 단계를 바탕으로 다음 단계를 연산하므로, 복잡한 산술이나 논리 문제에서 '시스템 2(느린 사고)'와 유사한 정교함을 발휘하게 됨.
|
|
3. **장점**:
|
|
* **Zero-shot**: 어떠한 퓨샷 예시(Examples)도 준비할 필요가 없음.
|
|
* **Versatility**: 수학, 논리, 상식 추론 등 분야를 가리지 않고 적용 가능.
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거에는 모델의 추론 능력이 순전히 파라미터 크기에만 달린 줄 알았으나, Zero-Shot-CoT 정책은 '명령어의 구조'만으로도 잠재된 지능을 수십 퍼센트 더 끌어올릴 수 있음을 입증하며 프롬프트 엔지니어링 정책의 위상을 격상시킴(RL Update).
|
|
- **정책 변화(RL Update)**: 엔터프라이즈 AI 솔루션 정책 수립 시, 답변의 정확도와 투명성을 높이기 위해 모든 AI 응답에 Zero-Shot-CoT를 기본 적용하여 '사고의 근거'를 함께 출력하게 하는 '과정 중심 응답 정책'이 확대됨.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Prompt-Engineering|Prompt-Engineering]], [[Zero Shot and Few Shot Learning|Zero Shot and Few Shot Learning]], [[Thought-Architecture|Thought-Architecture]], [[Decision Theory|Decision Theory]], Self-Correction Mechanisms
|
|
- **Modern Tech/Tools**: OpenAI o1 model (Internal CoT), LangChain advanced chains.
|
|
---
|