Files
2nd/01_Archive/2026-04-20/AST(Abstract Syntax Tree).md

4.3 KiB

id, category, confidence_score, tags, last_reinforced, github_commit
id category confidence_score tags last_reinforced github_commit
P-REINFORCE-AUTO-C7BE0D 10_Wiki/💡 Topics/Programming & Language 0.90
auto-reinforced
2026-04-20 [P-Reinforce] Continuous Worker - AST(Abstract Syntax Tree)

AST(Abstract Syntax Tree)

📌 한 줄 통찰 (The Karpathy Summary)

AST(Abstract Syntax Tree, 추상 구문 트리)는 소스 코드를 파싱하여 프로그래밍 언어의 문법적 구조를 트리 형태로 표현한 데이터 구조입니다. 공백이나 들여쓰기 같은 표면적인 레이아웃 정보는 배제하고 본질적인 구문 특징과 알고리즘 구조만을 보존하는 것이 특징입니다 [1]. 주로 SAST(정적 애플리케이션 보안 테스트), 린팅(Linting), 그리고 코드 작성자를 식별하는 코드 스타일로메트리(Code Stylometry) 분야에서 코드를 분석하는 핵심 기반으로 사용됩니다 [1, 2].

📖 구조화된 지식 (Synthesized Content)

  • AST의 구조적 특징 및 CST와의 차이 AST는 소스 코드를 구문 분석(Parsing)하여 만들어지며, 컴파일러나 분석 도구가 코드를 이해하는 추상적인 뼈대 역할을 합니다 [1, 2]. 코드의 들여쓰기나 줄 바꿈 등 레이아웃 속성을 철저히 보존하는 CST(Concrete Syntax Tree)와 달리, AST는 이러한 레이아웃 특징을 무시합니다 [1, 3]. 따라서 코드를 포맷팅하거나 여백을 크게 수정하더라도 구문이 동일하다면 파싱 후 생성되는 AST의 구조는 변하지 않습니다 [3].

  • 정적 분석(Static Analysis) 및 보안 스캐닝에서의 역할 소프트웨어의 취약점을 찾는 SAST 도구들은 소스 코드를 실행하지 않고 파싱하여 AST를 구축한 뒤, 여기에 다양한 분석 기법을 적용하여 코드의 논리적 오류와 보안 문제를 탐지합니다 [2]. 또한, eslint-plugin-jsx-a11y와 같은 린터 플러그인들은 AST를 기반으로 정적 검사를 수행해 코드 오류에 대한 즉각적인 피드백을 제공합니다 [4]. AI를 활용한 코드 리뷰 시스템 역시 조건문, 루프, try-catch 구조 등의 AST 노드 수를 인지하는 방식으로 코드의 구조적 복잡도를 계산합니다 [5].

  • 코드 스타일로메트리(작성자 식별)에서의 활용 기계학습을 활용해 소스 코드의 작성자를 추적하는 '코드 스타일로메트리' 연구에서 AST는 작성자 고유의 구문적(Syntactic) 특성을 추출하는 표준적인 표현 방식으로 사용됩니다 [1, 6]. 작성자가 선호하는 문법 구조, 노드의 바이그램(bigram), 트리 전체의 노드 수, 너비와 깊이 등 AST 기반의 특징들은 표면적인 타이포그래피나 변수명보다 위조하기가 훨씬 어려워 작성자의 고유한 알고리즘적 특징을 포착하는 데 매우 중요하게 활용됩니다 [7-9].

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
  • 정책 변화: Programming & Language 분야의 자동 자산화 수행.

🔗 지식 연결 (Graph)


Last updated: 2026-04-19

  • Raw Source: 00_Raw/2026-04-20/AST(Abstract Syntax Tree).md