chore(wiki): dangling 링크 canonical 정규화 (768파일/1200건)
이름만 다른(표기 변형) [[위키링크]]를 대상 문서의 canonical 제목으로 치환해 끊겼던 1,200개 링크를 연결. 제목/파일명 정규화 일치만 적용하고 별칭 매칭은 과병합 위험으로 제외(애매성 가드). 원본은 _link_reconcile_backup/ 에 백업. 도구: Datacollect/scripts/link_reconcile_apply.mjs Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
This commit is contained in:
@@ -269,7 +269,7 @@ def find_max_activating(sae, feature_idx, dataset, top_k=10):
|
||||
**기본값**: TransformerLens + activation patching 의 baseline. 매 large model = SAE.
|
||||
|
||||
## 🔗 Graph
|
||||
- 부모: [[Interpretability]] · [[AI-Safety]] · [[Mechanistic-Interpretability]]
|
||||
- 부모: [[Interpretability]] · [[AI Safety]] · [[Mechanistic-Interpretability]]
|
||||
- 변형: [[Activation-Patching]] · [[Path-Patching]] · [[ACDC]]
|
||||
- 응용: [[Steering]] · [[Induction-Head]]
|
||||
- Adjacent: [[Anthropic]] · [[AI_Safety_and_Alignment|AI-Alignment]]
|
||||
@@ -289,7 +289,7 @@ def find_max_activating(sae, feature_idx, dataset, top_k=10):
|
||||
## 🧪 검증 / 중복
|
||||
- Verified (Anthropic transformer-circuits.pub, Olsson induction heads, Wang IOI, ACDC paper).
|
||||
- 신뢰도 A.
|
||||
- Related: [[AI_Safety_and_Alignment|AI-Alignment]] · [[AI-Safety]] · [[Anthropic-Principle]] · [[Sparse-Autoencoder]].
|
||||
- Related: [[AI_Safety_and_Alignment|AI-Alignment]] · [[AI Safety]] · [[Anthropic-Principle]] · [[Sparse-Autoencoder]].
|
||||
|
||||
## 🕓 Changelog
|
||||
| 날짜 | 변경 |
|
||||
|
||||
Reference in New Issue
Block a user