docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

This commit is contained in:
Antigravity Agent
2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
+3 -3
View File
@@ -2,11 +2,11 @@
id: CIRCUIT-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [ai-[[Interpretability]], mechanistic-interpretability, neural-networks, circuits]
tags: [ai-[[Interpretability|Interpretability]], mechanistic-interpretability, neural-networks, circuits]
last_reinforced: 2026-04-26
---
# [[Circuit Discovery (회로 발견)]]
# [[Circuit Discovery (회로 발견)|Circuit Discovery (회로 발견)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "거대 모델 속에서 구체적인 기능을 수행하는 작은 알고리즘 지도를 그려라" — 신경망 내부의 특정 뉴런과 헤드들이 어떻게 연결되어 논리적 기능을 수행하는지 식별해내는 기계적 해석 가능성(Mechanistic Interpretability)의 핵심 기법.
@@ -21,7 +21,7 @@ last_reinforced: 2026-04-26
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순 시각화(Saliency Map) 수준을 넘어, 모델 내부에서 수학적으로 정의 가능한 알고리즘을 찾아내는 정교한 단계로 진화.
- **정책 변화:** 모델의 안전성 검증([[Alignment]])을 위해 잠재적인 유해 논리 회로가 형성되었는지 감지하는 도구로 활용 비중 확대.
- **정책 변화:** 모델의 안전성 검증([[Alignment|Alignment]])을 위해 잠재적인 유해 논리 회로가 형성되었는지 감지하는 도구로 활용 비중 확대.
## 🔗 지식 연결 (Graph)
- **Parent:** 10_Wiki/💡 Topics/AI