--- id: P-REINFORCE-WIKI-AI-LLM-FUNDAMENTALS title: "대규모 언어 모델 (LLM) 기반 코드 공학" category: Dev status: verified canonical_id: "" aliases: ["LLM", "AI 엔진", "Large Language Model"] duplicate_of: "" source_trust_level: A confidence_score: 0.98 tags: ["LLM", "AI_Engineering", "Code_Comprehension", "RAG", "MCP"] raw_sources: ["Datacollector_Export_2026-05-02"] last_reinforced: 2026-05-02 github_commit: "" --- # [[대규모 언어 모델 (LLM) 기반 코드 공학]] ## 1. 개요 LLM(대규모 언어 모델)은 방대한 소스 코드와 문서를 학습하여 자연어 질의응답, 코드 리뷰, 버그 탐지 및 문서화를 수행하는 AI 시스템의 핵심 엔진이다. 단순한 텍스트 생성을 넘어 복잡한 코드베이스의 구조적 맥락을 분석하고 설계 의도를 추론하는 능력을 갖추고 있다. ## 2. 주요 활용 분야 - **통합 지식 베이스**: 코드, Jira 티켓, DB 스키마, 기술 문서를 모두 인덱싱하여 '살아있는 지식 저장소' 구축. - **아키텍처 평가**: 단순 문법 검사를 넘어 보안 취약점, 모듈 간 결합도, API 계약 준수 여부 등 심층 평가 제공. - **의도 파악 (Intent Detection)**: PR 설명, 커밋 메시지 등 자연어 아티팩트를 분석하여 코드가 작성된 '이유'와 '목적'을 설명. ## 3. 트레이드오프 및 주의사항 - **환각 (Hallucination)**: 존재하지 않는 로직을 사실처럼 주장할 위험이 있어 LaaJ(LLM-as-a-Judge) 및 정적 분석 도구(SonarQube 등)와의 교차 검증 필수. - **컨텍스트 윈도우 제약**: 대규모 PR(50개 이상 파일 변경)에서는 세부 맥락을 놓칠 수 있는 한계 존재. - **실행 능력 부재**: 코드를 실행하거나 디버깅하는 것은 불가능하므로 실제 환경 테스트를 대체할 수 없음. ## 4. 지식 연결 (Related) - [[Model_Context_Protocol_Guide]]: LLM이 외부 저장소 데이터에 접근하기 위한 표준 인터페이스. - [[LLM-as-a-Judge (LaaJ)]]: 생성된 결과물의 신뢰성을 검증하는 아키텍처 패턴. - [[RAG (Retrieval-Augmented Generation)]]: 방대한 코드베이스 검색 증강 생성 기술. ## 🧪 검증 상태 (Validation) - **정보 상태**: 검증 완료 (Verified) - **출처 신뢰도**: A - **검토 이유**: 소프트웨어 엔지니어링 도메인에서의 LLM 역할과 한계를 명확히 규정.