docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

This commit is contained in:
Antigravity Agent
2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
+2 -2
View File
@@ -6,7 +6,7 @@ tags: [auto-reinforced, benchmarks, evaluation, performance-metrics, standardiza
last_reinforced: 2026-04-20
---
# [[Benchmarks]]
# [[Benchmarks|Benchmarks]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "지능의 줄자: 서로 다른 시스템이나 알고리즘의 성능을 동일한 잣대로 비교하기 위해 설계된 표준화된 문제 세트이며, 기술 혁신의 이정표(Milestone)를 제시하는 경쟁의 마당."
@@ -28,6 +28,6 @@ last_reinforced: 2026-04-20
- **정책 변화(RL Update)**: 단순히 기술적 성능뿐만 아니라 윤리적 안정성과 유해성을 평가하는 'Safety Benchmark 정책'이 모델 배포의 필수 통과 관문이 됨.
## 🔗 지식 연결 (Graph)
- [[Assessment]], [[Algorithmic Fairness]], Foundational Models, [[Ps-Reinforce]], [[Safety & Reliability]]
- [[Assessment|Assessment]], [[Algorithmic Fairness|Algorithmic Fairness]], Foundational Models, [[Ps-Reinforce|Ps-Reinforce]], [[Safety & Reliability|Safety & Reliability]]
- **Modern Tech/Tools**: Hugging Face Open LLM Leaderboard, HELM (Holistic Evaluation of Language Models).
---