Files
2nd/10_Wiki/Topics_Blog/Active-Reasoning.md
T

2.5 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AUTO-ACRE-001 10_Wiki/💡 Topics/AI 0.94
auto-reinforced
active-reasoning
inference-optimization
chain-of-thought
cognitive-ai
2026-04-20

Active-Reasoning

📌 한 줄 통찰 (The Karpathy Summary)

"생각의 주도권을 잡기: 주어진 질문에 답하는 수동적 추론을 넘어, 스스로 가설을 세우고, 정보를 보완하고, 중간 과정을 검증하며 최적의 논리 경로를 개척해 나가는 능동적 지적 행위."

📖 구조화된 지식 (Synthesized Content)

능동적 추론(Active-Reasoning)은 시스템이 목표 달성을 위해 필요한 정보를 스스로 식별하고, 불확실성을 해소하기 위해 사고 과정을 동적으로 재구성하는 고도의 추론 패러다임입니다.

  1. 핵심 메커니즘:
    • Hypothesis Generation: 단순 예측이 아닌 여러 가지 가능성(Scenario)을 스스로 생성.
    • Information Seeking: 답을 내기에 지식이 부족하면 외부 도구(검색, API)를 사용하거나 사용자에게 되물을 것을 결정.
    • Self-Verification (Step-by-step): 각 추론 단계가 타당한지 스스로 검열하고 오류 발견 시 즉각 수정 (Zero-Shot-CoT와 결합).
  2. 적용 분야:
    • 복잡한 코딩 디버깅 에이전트, 의료 진단 지원 시스템, 다단계 전략 게임 AI.
  3. 시스템 2와의 연결:
    • 다니엘 카너먼의 '느린 사고(System 2)'와 유사함. 즉각적인 직관(System 1) 대신 논리적 뼈대를 구축하며 시간을 들여 고민함.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거 언어 모델 정책은 확률적 토큰 생성(Next-token prediction)에만 매몰되었으나, 현대 인공지능 정책은 추론 전용 모델(예: OpenAI o1) 출시를 통해 모델이 답을 내기 전 내부적으로 수천 번 '능동적으로 생각'하는 정책을 실현함(RL Update).
  • 정책 변화(RL Update): 답변의 투명성 확보를 위해, AI가 '생각한 과정'을 숨기지 않고 사용자에게 구조화된 형태로 보여주도록 하는 '생각의 가시화 정책'이 고난도 비즈니스 솔루션의 필수 요건이 됨.

🔗 지식 연결 (Graph)