feat: Wiki 지식 자산 업데이트 - UX Scenarios, Frontend, Game Design, Topics 추가 [2026-05-08]

This commit is contained in:
2026-05-08 19:52:07 +09:00
parent 9dd3d40662
commit 5ba5a55c78
3984 changed files with 334557 additions and 28839 deletions
+74 -22
View File
@@ -1,26 +1,78 @@
---
id: mission_5fe3787020b6
date: 2026-05-05T16:39:08.000Z
type: knowledge_artifact
standard: P-Reinforce v3.0
tags: [automated, datacollector, brain_sync]
id: wiki-2026-0508-test-time-computing
title: Test time computing
category: 10_Wiki/Topics
status: verified
canonical_id: self
aliases: []
duplicate_of: none
source_trust_level: A
confidence_score: 0.92
tags: [uncategorized]
raw_sources: []
last_reinforced: 2026-05-08
github_commit: pending
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
---
# [[Test-time computing]]
## 📌 Brief Summary
Test-time computing은 추론(Inference) 단계 자체에 막대한 컴퓨팅 연산을 할당하여 대규모 언어 모델(LLM)을 확장(Scaling)하는 최신 접근 방식입니다 [1]. 이 방식을 통해 AI 모델은 더 긴 컨텍스트 창(Context windows)을 처리하고 더 방대한 제안을 생성할 수 있습니다 [1]. 현재 AI 기업들이 추구하는 LLM 확장 전략의 성공을 위해 필수적인 요소로 간주되고 있습니다 [2].
## 📖 Core Content
* **토큰 사용량의 기하급수적 증가:** AI 기업들이 에이전트적(Agentic) 행동을 시연하기 위해 경쟁함에 따라, 계획 체인(Planning chains)과 메모리 상태를 유지하기 위해 훨씬 더 많은 토큰이 필요해졌습니다 [3]. 2021년의 일반적인 기업 쿼리는 220개 미만의 토큰을 사용했지만, 2025년 기준 GPT-4 Pro 및 ChatGPT-5와 같은 모델은 Test-time computing을 기반으로 단일 교환에서 약 22,000개의 토큰을 처리합니다 [3].
* **미래 전망:** 이러한 접근 방식으로 인해 최전선(Frontier) AI 모델은 4년 전보다 100배 이상의 토큰을 요구하며, 작업 복잡성에 따라 2030년에는 쿼리당 토큰 수가 150,000개에서 1,500,000개까지 급증할 것으로 예상됩니다 [4].
* **데이터 요구량 팽창:** Test-time 확장 전략은 실제 데이터(Authentic data)뿐만 아니라 기계가 생성한 조잡한 데이터(Machine-generated slop)를 포함하여 점점 더 방대한 양의 데이터를 필요로 합니다 [5].
## ⚖️ Trade-offs & Caveats
* **수확 체감과 천문학적 비용:** Test-time computing은 막대한 비용이 드는 전략임에도 불구하고 성능 향상은 미미한 수준에 그칩니다 [6]. 추론 과정에 막대한 컴퓨팅을 투입하더라도, 5,000만 달러의 비용과 3개월의 GPU 시간을 들여 고작 0.3%의 성능 향상을 얻는 수준에 머물러 있습니다 [6].
* **비용 절감 효과의 상쇄:** 칩과 소프트웨어의 효율성 개선으로 토큰당 비용이 감소하더라도, Test-time computing으로 인한 토큰 사용량의 폭발적인 증가가 비용 절감 효과를 완전히 상쇄해버립니다 [2]. 결과적으로 추론에 더 많은 컴퓨팅을 쏟아붓는다고 해서 더 나은 결과나 효율성이 보장되지 않습니다 [6].
* **에너지 소비 폭증:** 효율성 향상이 무색하게 토큰 사용이 크게 팽창하면서 총비용과 총 에너지 사용량이 급증하게 되며, 이는 과거 산업 에너지 시스템에서 볼 수 있었던 반등(Rebound) 패턴을 그대로 재현합니다 [2].
* **자기 중독(Self-poisoning) 위험 가속화:** Test-time 확장 전략은 끝없이 많은 데이터를 요구하기 때문에, AI 모델이 스스로 생성한 불량 데이터까지 섭취하게 만들어 모델의 '자기 중독' 위험을 기하급수적으로 증가시키는 치명적인 부작용을 낳고 있습니다 [5].
---
redirect_to: "[[생성형_AI_및_LLM_엔지니어링_표준]]"
canonical_id: "wiki-2026-0507-106"
---
*Last updated: 2026-05-05*
# Redirect
이 문서는 Canonical 문서인 통합되었습니다.
모든 최신 지식과 세부 내용은 위 링크를 참조하십시오.
## 📌 한 줄 통찰 (The Karpathy Summary)
> Test-time compute는 학습 후 추론 단계에서 더 많은 연산을 투입(샘플 증강·체인 오브 사고·반복 증류 등)해 추가 학습 없이 정확도를 높이는 패러다임이다.
## 📖 구조화된 지식 (Synthesized Content)
**추출된 패턴:** "파라미터 키우기" 대신 "추론 시간 키우기" — OpenAI o1/DeepSeek-R1처럼 thinking tokens를 늘려 reasoning 깊이를 확장.
**세부 내용:**
- **Chain-of-Thought**: 중간 추론 단계를 명시적으로 생성.
- **Self-Consistency**: 여러 샘플 후 다수결.
- **Tree-of-Thoughts / Graph-of-Thoughts**: 분기 탐색.
- **Verifier-Guided Search**: 검증자로 후보를 가지치기.
- **Process Reward Model (PRM)**: 단계별 보상으로 reasoning 강화.
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
**언제 이 지식을 쓰는가:**
- *(TODO)*
**언제 쓰면 안 되는가:**
- *(TODO)*
## 🧪 검증 상태 (Validation)
- **정보 상태:** draft
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
## 🧬 중복 검사 (Duplicate Check)
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
- **과거 데이터와의 충돌:** 없음
- **정책 변화:** 없음
## 🔗 지식 연결 (Graph)
- **Parent:** [[10_Wiki/Topics]]
- **Related:** *(TODO: 최소 2개)*
- **Opposite / Trade-off:** *(TODO)*
- **Raw Source:** 직접 입력
## 🕓 변경 이력 (Changelog)
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|------|-----------|-----------|--------|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |