Files
2nd/10_Wiki/Topics/AI_and_ML/Zero-Shot-Chain-of-Thought.md
T

2.7 KiB


id: P-Reinforce-AUTO-ZSCOT-001 category: Unified confidence_score: 0.98 tags: [auto-reinforced, zero-shot-cot, chain-of-thought, Reasoning, prompting, llm] last_reinforced: 2026-04-20

Zero-Shot-Chain-of-Thought

📌 한 줄 통찰 (The Karpathy Summary)

"마법의 주문 '차근차근 생각해보자': 복잡한 문제에 대해 결과를 바로 묻지 않고 생각의 과정을 요구함으로써, AI의 논리 회로를 강제로 활성화해 정답률을 드라마틱하게 높이는 추론 최적화 기폭제."

📖 구조화된 지식 (Synthesized Content)

제로샷 연쇄 사고(Zero-Shot Chain-of-Thought, Zero-Shot-CoT)는 2022년 Kojima 등이 제안한 기법으로, 프롬프트 끝에 특정 문구를 덧붙이는 것만으로 LLM의 다단계 추론 능력을 이끌어내는 매우 단순하면서도 강력한 프롬프트 엔지니어링 기술입니다.

  1. 핵심 트리거 문구:
    • "Let's think step by step (차근차근 단계별로 생각해보자)"
  2. 작동 원리:
    • 이 문구는 모델이 다음에 올 토큰을 생성할 때, '최종 정답' 대신 '중간 추론 과정'을 먼저 생성하게 유도함.
    • 모델은 자신이 앞서 생성한 추론 단계를 바탕으로 다음 단계를 연산하므로, 복잡한 산술이나 논리 문제에서 '시스템 2(느린 사고)'와 유사한 정교함을 발휘하게 됨.
  3. 장점:
    • Zero-shot: 어떠한 퓨샷 예시(Examples)도 준비할 필요가 없음.
    • Versatility: 수학, 논리, 상식 추론 등 분야를 가리지 않고 적용 가능.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 모델의 추론 능력이 순전히 파라미터 크기에만 달린 줄 알았으나, Zero-Shot-CoT 정책은 '명령어의 구조'만으로도 잠재된 지능을 수십 퍼센트 더 끌어올릴 수 있음을 입증하며 프롬프트 엔지니어링 정책의 위상을 격상시킴(RL Update).
  • 정책 변화(RL Update): 엔터프라이즈 AI 솔루션 정책 수립 시, 답변의 정확도와 투명성을 높이기 위해 모든 AI 응답에 Zero-Shot-CoT를 기본 적용하여 '사고의 근거'를 함께 출력하게 하는 '과정 중심 응답 정책'이 확대됨.

🔗 지식 연결 (Graph)