docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -6,7 +6,7 @@ tags: [auto-reinforced, logical-reasoning, counterexample, debate, critical-thin
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Arguing-by-Counterexample]]
|
||||
# [[Arguing-by-Counterexample|Arguing-by-Counterexample]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "단 하나의 예외로 거대 이론 무너뜨리기: '모든 백조는 희다'라는 주장에 대해 단 한 마리의 흑고니를 보여줌으로써, 일반화된 명제의 오류를 즉각적으로 증명하는 가장 날카로운 논리적 반박 기술."
|
||||
@@ -27,6 +27,6 @@ last_reinforced: 2026-04-20
|
||||
- **정책 변화(RL Update)**: AI 모델의 안전성 검증 정책에서, 모델이 "나는 인간을 해치지 않는다"고 장담하더라도 레드팀(Red-teaming)이 단 하나의 공격 성공 사례(반례)를 찾아내면 안전 등급을 강등시키는 'Worst-case 기반 안전 정책'이 표준이 됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Logic]], Philosophy of Science, [[Anomaly-Detection]], [[Self-Correction Mechanisms]], [[Type 1 vs Type 2 Errors]]
|
||||
- [[Logic|Logic]], Philosophy of Science, [[Anomaly-Detection|Anomaly-Detection]], Self-Correction Mechanisms, [[Type 1 vs Type 2 Errors|Type 1 vs Type 2 Errors]]
|
||||
- **Modern Tech/Tools**: Formal verification methods, Adversarial red-teaming.
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user