bluemsi/2nd

Files

T

koriweb 3d9d0077cc feat: organize and categorize 1535 knowledge assets into wiki topics (2026-04-29)

2026-04-29 18:14:09 +09:00

2.5 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AUTO-ACRE-001

10_Wiki/💡 Topics/AI

0.94

auto-reinforced

active-reasoning

inference-optimization

chain-of-thought

cognitive-ai

2026-04-20

Active-Reasoning

📌 한 줄 통찰 (The Karpathy Summary)

"생각의 주도권을 잡기: 주어진 질문에 답하는 수동적 추론을 넘어, 스스로 가설을 세우고, 정보를 보완하고, 중간 과정을 검증하며 최적의 논리 경로를 개척해 나가는 능동적 지적 행위."

📖 구조화된 지식 (Synthesized Content)

능동적 추론(Active-Reasoning)은 시스템이 목표 달성을 위해 필요한 정보를 스스로 식별하고, 불확실성을 해소하기 위해 사고 과정을 동적으로 재구성하는 고도의 추론 패러다임입니다.

핵심 메커니즘:
- Hypothesis Generation: 단순 예측이 아닌 여러 가지 가능성(Scenario)을 스스로 생성.
- Information Seeking: 답을 내기에 지식이 부족하면 외부 도구(검색, API)를 사용하거나 사용자에게 되물을 것을 결정.
- Self-Verification (Step-by-step): 각 추론 단계가 타당한지 스스로 검열하고 오류 발견 시 즉각 수정 (Zero-Shot-CoT와 결합).
적용 분야:
- 복잡한 코딩 디버깅 에이전트, 의료 진단 지원 시스템, 다단계 전략 게임 AI.
시스템 2와의 연결:
- 다니엘 카너먼의 '느린 사고(System 2)'와 유사함. 즉각적인 직관(System 1) 대신 논리적 뼈대를 구축하며 시간을 들여 고민함.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 과거 언어 모델 정책은 확률적 토큰 생성(Next-token prediction)에만 매몰되었으나, 현대 인공지능 정책은 추론 전용 모델(예: OpenAI o1) 출시를 통해 모델이 답을 내기 전 내부적으로 수천 번 '능동적으로 생각'하는 정책을 실현함(RL Update).
정책 변화(RL Update): 답변의 투명성 확보를 위해, AI가 '생각한 과정'을 숨기지 않고 사용자에게 구조화된 형태로 보여주도록 하는 '생각의 가시화 정책'이 고난도 비즈니스 솔루션의 필수 요건이 됨.

🔗 지식 연결 (Graph)

Zero-Shot-Chain-of-Thought, Self-Correction Mechanisms, Thought-Architecture, Decision Theory, Foundational Models
Modern Tech/Tools: Chain-of-Thought (CoT) frameworks, Logic-integrated LLMs.