CAD 렌더링 최적화

📌 한 줄 통찰 (The Karpathy Summary)

CAD 렌더링 최적화는 브라우저 및 통합 GPU(iGPU) 환경에서 메모리 대역폭과 CPU-GPU 간 통신 병목을 극복하여 수백만 개의 폴리곤을 가진 대규모 다중 본체 어셈블리(Multi-Body Assemblies)를 부드럽게 렌더링하는 일련의 기술적 과정입니다 [1, 2]. 이를 위해 BatchedMesh나 InstancedMesh를 통한 드로우 콜 최소화, 정밀도 붕괴 방지를 위한 원점 이동(Origin-shifting), 메모리 관리 효율화를 위한 Web Worker 및 SharedArrayBuffer 활용이 필수적으로 요구됩니다 [3-5]. 또한, 오버드로우를 줄이는 깊이 사전 패스(Depth Pre-Pass)와 시각적 끊김이 없는 디더링 LOD 등의 렌더링 기법을 결합하여 고성능의 시각화 경험을 제공합니다 [6-8].

📖 구조화된 지식 (Synthesized Content)

하드웨어 및 메모리 대역폭의 병목 극복: 통합 GPU(Intel UHD, AMD Radeon Vega 등)는 UMA(Unified Memory Architecture) 환경을 사용하여 시스템 RAM을 CPU와 공유하므로 메모리 대역폭이 주된 성능 제약이 됩니다 [1, 9]. 100만 개 이상의 삼각형을 가진 CAD 모델을 파싱하고 디코딩할 때 발생하는 메인 스레드 프리징과 메모리 중복을 방지하기 위해 Web Worker와 SharedArrayBuffer를 연동한 제로 카피(Zero-copy) 아키텍처를 도입해야 합니다 [5].
지오메트리 통합과 드로우 콜 최적화: CAD 어셈블리를 구성하는 수많은 부품을 개별 메쉬로 렌더링하면 엄청난 드로우 콜 오버헤드가 발생합니다 [2]. 볼트나 브래킷 같은 반복 부품은 InstancedMesh로 처리하고, 고유한 기하학적 형태가 섞인 다양한 부품들은 BatchedMesh를 사용해 단일 드로우 콜로 묶어 처리해야 iGPU의 오버헤드를 크게 줄일 수 있습니다 [3, 10]. 정적인 하위 어셈블리는 지오메트리를 타일 단위로 병합(mergeBufferGeometries)하는 전략을 활용할 수 있습니다 [11].
좌표 정밀도 붕괴(Precision Collapse) 방지: CAD 데이터의 거대한 좌표계(예: 10^7 단위 이상)를 WebGL의 32-bit float 환경으로 가져오면 소수점 이하 정밀도가 부족해져 정점이 흔들리거나 진동하는 현상(Vertex Snapping/Jitter)이 발생합니다 [4]. 이를 막기 위해 64-bit 공간에서 전체 어셈블리의 중심(basePoint)을 계산한 뒤, 정점 좌표를 오프셋 처리(Re-centering shift)하여 GPU에 업로드해야 합니다 [4].
가시성 판별(Visibility Determination) 및 오클루전 컬링: 복잡한 내부 부품이 겹쳐 있는 CAD 모델에서 오버드로우를 줄이기 위해 색상 쓰기를 비활성화한 채 Z-버퍼만 먼저 채우는 '깊이 사전 패스(Depth Pre-Pass)'를 수행하면 프래그먼트 셰이더 부하를 최대 30%까지 줄일 수 있습니다 [6]. 또한 옥트리(Octree)나 BVH(Bounding Volume Hierarchy)를 통해 CPU 공간 분할을 적용하여 보이지 않는 노드에 대한 연산을 렌더링에서 배제합니다 [12].
LOD 및 엣지(Edge) 렌더링 최적화: 부품을 정밀 검토할 때 시각적으로 튀는 팝핑(Popping) 현상을 막기 위해, 화면 공간 디더링 패턴(Dithered LOD Blend)을 활용한 매끄러운 형태의 LOD 전환 기법을 구현합니다 [7, 13]. 또한 CAD 도면 특유의 날카로운 모서리(Wireframe/Edge)를 표현하기 위해 EdgesGeometry를 사용하면 정점 부하가 2배로 늘어나므로, 무게 중심 좌표(Barycentric Coordinate)를 활용하여 단일 패스의 프래그먼트 셰이더 안에서 절차적으로 엣지를 렌더링하는 기법이 권장됩니다 [14, 15].
자원 및 상태 관리 (State Management): 수백 개의 색상을 표현하기 위해 개별 재질(Material)을 번갈아 쓰지 않고 '텍스처 아틀라스(Texture Atlas)'와 파트 ID를 활용해 셰이더 전환을 최소화해야 합니다 [16]. 아울러 배터리 소모와 발열을 막기 위해 변경 사항이 있을 때만 프레임을 업데이트하는 Render-on-Demand(요청 시 렌더링) 방식을 적용하며, 값비싼 물리 기반 렌더링(MeshStandardMaterial) 대신 MeshPhongMaterial 또는 'Flat Shaded + Edge' 커스텀 셰이더를 사용하여 프래그먼트 연산 비용을 아낍니다 [8, 17-19].

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
정책 변화: Programming & Language 분야의 자동 자산화 수행.

🔗 지식 연결 (Graph)

Related Topics: BatchedMesh, InstancedMesh, Depth Pre-Pass, SharedArrayBuffer, Frustum Culling, Level of Detail (LOD)
Projects/Contexts: WebGPU 대규모 건설 뷰어, BIM 모델 시뮬레이션
Contradictions/Notes: 지오메트리 병합(BufferGeometryUtils.mergeBufferGeometries) 기법은 드로우 콜을 가장 효과적으로 줄여주지만, 단일 바운딩 볼륨으로 묶이기 때문에 시야 절두체 컬링(Frustum Culling)의 효율성을 떨어뜨린다는 딜레마를 가집니다 [11]. 또한, InstancedMesh는 단일 지오메트리의 반복 렌더링에는 매우 유리하지만 서로 다른 기하학적 구조를 가진 부품이 수천 개 모인 CAD 모델에는 부적합하며, 이 경우 다중 지오메트리를 지원하는 BatchedMesh를 사용하는 것이 더 올바른 대안입니다 [3, 10, 20].

Last updated: 2026-04-19

Raw Source: 00_Raw/2026-04-20/CAD 렌더링 최적화.md

5.8 KiB Raw Blame History

CAD 렌더링 최적화

📌 한 줄 통찰 (The Karpathy Summary)

📖 구조화된 지식 (Synthesized Content)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

🔗 지식 연결 (Graph)

5.8 KiB

Raw Blame History