docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links

2026-05-02 09:18:34 +09:00
parent c84dcb8371
commit 6445fcc05b
13150 changed files with 55394 additions and 100862 deletions
@@ -1,13 +1,13 @@
 ---
 id: P-REINFORCE-AUTO-952EE7
-category: "[[10_Wiki/💡 Topics/Programming & Language]]"
+category: "10_Wiki/💡 Topics/Programming & Language"
 confidence_score: 0.90
 tags: [auto-reinforced]
 last_reinforced: 2026-04-20
 github_commit: "[P-Reinforce] Continuous Worker - 코드 서식 지정과 축소가 코드 스타일로메트리(작성자 인식)에 미치는 영향을 평가하는 기계 학습 모델 분류 연구"
 ---

-# [[코드 서식 지정과 축소가 코드 스타일로메트리(작성자 인식)에 미치는 영향을 평가하는 기계 학습 모델 분류 연구]]
+# [[코드 서식 지정과 축소가 코드 스타일로메트리(작성자 인식)에 미치는 영향을 평가하는 기계 학습 모델 분류 연구|코드 서식 지정과 축소가 코드 스타일로메트리(작성자 인식)에 미치는 영향을 평가하는 기계 학습 모델 분류 연구]]

 ## 📌 한 줄 통찰 (The Karpathy Summary)
 > 이 연구는 소프트웨어 개발에서 흔히 쓰이는 코드 서식 지정(formatting)과 코드 축소(minification)가 코드 스타일로메트리(작성자 자동 인식) 시스템의 정확도에 어떠한 영향을 미치는지 정량적으로 평가한 논문입니다 [1], [2]. 연구진은 Python 코드를 구체적 구문 트리(CST)로 표현하고 code2vec 기반의 기계 학습 분류 모델을 사용하여 작성자 식별 실험을 수행했습니다 [1]. 실험 결과, 서식 지정과 축소 과정은 작성자 인식 정확도를 유의미하게 감소시켰으나, 여전히 작성자를 식별할 수 있는 수준의 정보는 남아있는 것으로 나타났습니다 [1], [3].
@@ -33,11 +33,11 @@ github_commit: "[P-Reinforce] Continuous Worker - 코드 서식 지정과 축소
 - **정책 변화:** Programming & Language 분야의 자동 자산화 수행.

 ## 🔗 지식 연결 (Graph)
- **Related Topics:** [[코드 스타일로메트리]], [[작성자 인식(Authorship Attribution)]], [[구체적 구문 트리(CST)]], [[추상 구문 트리(AST)]], [[code2vec]], [[기계 학습 분류기(Machine Learning Classifier)]]
- **Projects/Contexts:** [[Google Code Jam 데이터셋]], [[Black (Python 코드 포매터)]], [[Python Minifier]]
+- **Related Topics:** 코드 스타일로메트리, 작성자 인식(Authorship Attribution), 구체적 구문 트리(CST), [[추상 구문 트리(AST)|추상 구문 트리(AST)]], code2vec, 기계 학습 분류기(Machine Learning Classifier)
+- **Projects/Contexts:** Google Code Jam 데이터셋, Black (Python 코드 포매터), Python Minifier
 - **Contradictions/Notes:** 소스에 따르면 서식 지정된 코드(52.68%)와 축소된 코드(50.00%)의 작성자 인식 정확도는 원본 AST 기반 모델의 정확도(51.00%)와 매우 유사한 수치를 보입니다. 이는 서식 지정과 축소라는 과정이 CST가 제공하는 구체적 구문 특징의 이점을 대부분 상쇄시키지만, AST로도 포착 가능한 더 깊은 수준의 추상적 구문 내재 스타일까지는 파괴하지 못한다는 점을 의미합니다 [15].

 ---
 *Last updated: 2026-04-19*
- Raw Source: [[00_Raw/2026-04-20/코드 서식 지정과 축소가 코드 스타일로메트리(작성자 인식)에 미치는 영향을 평가하는 기계 학습 모델 분류 연구.md]]
+- Raw Source: 00_Raw/2026-04-20/코드 서식 지정과 축소가 코드 스타일로메트리(작성자 인식)에 미치는 영향을 평가하는 기계 학습 모델 분류 연구.md
 ---