docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -2,11 +2,11 @@
|
||||
id: CIRCUIT-001
|
||||
category: "10_Wiki/💡 Topics/AI"
|
||||
confidence_score: 1.0
|
||||
tags: [ai-[[Interpretability]], mechanistic-interpretability, neural-networks, circuits]
|
||||
tags: [ai-[[Interpretability|Interpretability]], mechanistic-interpretability, neural-networks, circuits]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Circuit Discovery (회로 발견)]]
|
||||
# [[Circuit Discovery (회로 발견)|Circuit Discovery (회로 발견)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "거대 모델 속에서 구체적인 기능을 수행하는 작은 알고리즘 지도를 그려라" — 신경망 내부의 특정 뉴런과 헤드들이 어떻게 연결되어 논리적 기능을 수행하는지 식별해내는 기계적 해석 가능성(Mechanistic Interpretability)의 핵심 기법.
|
||||
@@ -21,7 +21,7 @@ last_reinforced: 2026-04-26
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순 시각화(Saliency Map) 수준을 넘어, 모델 내부에서 수학적으로 정의 가능한 알고리즘을 찾아내는 정교한 단계로 진화.
|
||||
- **정책 변화:** 모델의 안전성 검증([[Alignment]])을 위해 잠재적인 유해 논리 회로가 형성되었는지 감지하는 도구로 활용 비중 확대.
|
||||
- **정책 변화:** 모델의 안전성 검증([[Alignment|Alignment]])을 위해 잠재적인 유해 논리 회로가 형성되었는지 감지하는 도구로 활용 비중 확대.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- **Parent:** 10_Wiki/💡 Topics/AI
|
||||
|
||||
Reference in New Issue
Block a user