4.2 KiB
4.2 KiB
id, title, category, status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, tags, raw_sources, last_reinforced, github_commit, inferred_by, tech_stack
| id | title | category | status | canonical_id | aliases | duplicate_of | source_trust_level | confidence_score | tags | raw_sources | last_reinforced | github_commit | inferred_by | tech_stack | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| wiki-2026-0508-tokenization-economics | Tokenization Economics | 10_Wiki/Topics | needs_review | self |
|
none | A | 1.0 |
|
2026-05-04 | pending | Claude Opus 4.7 (auto-normalize 2026-05-08) |
|
Tokenization Economics
📌 한 줄 통찰 (The Karpathy Summary)
"토큰이 곧 돈이다: 모델의 연산량, VRAM 사용량, API 비용, 그리고 응답 지연 시간이 모두 '토큰의 개수'에 정비례하므로, 토큰 효율성을 최적화하는 것이 지속 가능한 AI 서비스의 핵심 경제학."
📖 구조화된 지식 (Synthesized Content)
토큰 경제학(Token Economics)은 시스템 레벨에서 토큰 사용량을 최적화하여 효율과 비용의 균형을 맞추는 엔지니어링 전략입니다.
- 토크나이저 트레이드오프 삼각형 (Triangle):
- Cost (비용): 토큰 수가 많을수록 API 비용과 인프라 유지비가 증가합니다.
- Performance (성능): 토큰 수가 많으면 생성 지연 시간(Latency)이 늘어나고 처리량(Throughput)이 줄어듭니다.
- Quality (품질): 너무 공격적으로 토큰을 압축하거나 줄이면 모델의 이해도나 표현의 정밀도가 떨어집니다.
- 최적화 전략:
- Dynamic Allocation: 고정된 길이를 할당하는 대신, 실제 입력에 맞춰 시퀀스 길이를 동적으로 조정하여 메모리 낭비를 줄입니다 (최대 45% 절감).
- Predictive Tokenization: 작업의 복잡도를 예측하여 적절한 토큰 예산을 할당합니다.
- Prefix Caching: 반복되는 시스템 프롬프트나 대규모 문서는 토크나이징 결과를 캐싱하여 재사용합니다.
- 데이터 엔트로피 최적화:
- 불필요한 공백, 중복 서식, 노이즈 텍스트를 전처리 단계에서 제거하여 '의미당 토큰 수'를 최소화합니다.
⚠️ 모순 및 업데이트 (Contradictions & Updates)
- 다국어 처리 오버헤드: 특정 언어(예: 텔루구어)는 영어보다 7배 이상의 토큰을 소모할 수 있어, 글로벌 서비스 설계 시 예기치 못한 비용 폭발의 위험이 있습니다.
- 중복의 함정: RAG에서 청크 중첩(Overlap)을 과하게 사용하면 동일한 정보가 여러 번 토큰화되어 VRAM을 낭비하게 됩니다.
🔗 지식 연결 (Graph)
- 상위 개념: Tokenization & Subword Processing
- 연관 기술: Prefix Caching, KV Cache Management
- 해결 과제: LLM Inference Optimization
Last updated: 2026-05-04
🤖 LLM 활용 힌트 (How to Use This Knowledge)
언제 이 지식을 쓰는가:
- (TODO)
언제 쓰면 안 되는가:
- (TODO)
🧪 검증 상태 (Validation)
- 정보 상태: needs_review
- 출처 신뢰도: A
- 검토 이유: (P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)
🧬 중복 검사 (Duplicate Check)
- 기존 유사 문서: (TODO: 인덱서 클러스터 리포트 참조)
- 처리 방식: UPDATE (자동 정규화)
- 처리 이유: Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
🕓 변경 이력 (Changelog)
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|---|---|---|---|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
💻 코드 패턴 (Code Patterns)
패턴 1: (TODO: 이 프로젝트 컨벤션 반영한 구조 스켈레톤)
# TODO
🤔 의사결정 기준 (Decision Criteria)
선택 A를 써야 할 때:
- (TODO)
선택 B를 써야 할 때:
- (TODO)
기본값:
(TODO)
❌ 안티패턴 (Anti-Patterns)
- [안티패턴]: (TODO: 무엇을 하면 안 되는가 + 이유 + 대신 무엇을)