chore(wiki): dangling 링크 canonical 정규화 (768파일/1200건)
이름만 다른(표기 변형) [[위키링크]]를 대상 문서의 canonical 제목으로 치환해 끊겼던 1,200개 링크를 연결. 제목/파일명 정규화 일치만 적용하고 별칭 매칭은 과병합 위험으로 제외(애매성 가드). 원본은 _link_reconcile_backup/ 에 백업. 도구: Datacollect/scripts/link_reconcile_apply.mjs Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
This commit is contained in:
@@ -210,10 +210,10 @@ def benchmark(model, batch_sizes, seq_lens):
|
||||
**기본값**: 매 modern LLM = GQA (4-8 KV heads). 매 quality > 1% loss = MHA. 매 extreme constraint = MQA.
|
||||
|
||||
## 🔗 Graph
|
||||
- 부모: [[Attention-Mechanism]] · [[Transformer]]
|
||||
- 부모: [[Attention Mechanism]] · [[Transformer]]
|
||||
- 변형: [[Multi-Head-Attention]] · [[Multi-Query-Attention]]
|
||||
- 응용: [[Llama]] · [[Flash Attention]] · [[LLM_Optimization_and_Deployment_Strategies|vLLM]]
|
||||
- Adjacent: [[KV-Cache]] · [[Paged-Attention]] · [[Foundation-Models]]
|
||||
- Adjacent: [[KV-Cache]] · [[PagedAttention]] · [[Foundation-Models]]
|
||||
|
||||
## 🤖 LLM 활용
|
||||
**언제**: 매 모든 modern LLM. 매 long context. 매 high-batch serving.
|
||||
|
||||
Reference in New Issue
Block a user