2nd/10_Wiki/Topics/CV_Synthesis.md

---
id: P-REINFORCE-AUTO-CVSY-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 0.92
tags: [auto-reinforced, cv-synthesis, computer-vision, synthetic-data, image-generation, computer-graphics]
last_reinforced: 2026-04-20
---

# [[CV_Synthesis]]

## 📌 한 줄 통찰 (The Karpathy Summary)
> "가상의 눈을 위한 가상의 데이터: 실제 촬영 없이도 컴퓨터 그래픽스와 AI를 이용해 완벽하게 라벨링된 대규모 학습 데이터를 생성함으로써, 컴퓨터 비전 모델 개발의 높은 비용과 데이터 부족 문제를 해결하는 지능형 제조 공정."

## 📖 구조화된 지식 (Synthesized Content)
컴퓨터 비전 합성(CV Synthesis)은 가상의 환경에서 인공적인 이미지나 비디오 데이터를 생성하여 모델을 학습시키는 기술입니다.

1.  **필요성**:
    *   **Perfect Ground Truth**: 합성 데이터는 객체의 위치, 각도, 픽셀 단위 마스크 정보를 오차 없이 자동으로 가짐.
    *   **Rare Events**: 도로 위 사고 상황 등 실제로 수집하기 어려운 희귀 사례(Black-Swan)를 무한히 생성 가능. (Black-Swan과 연결)
    *   **Privacy**: 실제 사람의 얼굴이나 번호판을 쓰지 않아도 되므로 개인정보 보호 이슈에서 자유로움.
2.  **핵심 기술**:
    *   **Sim-to-Real**: 가상 세계(Simulator)와 실제 세계 간의 차이(Domain Gap)를 줄이기 위한 도메인 적응 기술.

## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 합성 데이터가 너무 '가짜 티'가 나서 성능 저하를 유발한다는 정책적 우려가 컸으나, 현대 정책은 확산 모델(Diffusion)이나 렌더링 최적화(Gaussian Splatting)를 통한 '극사실주의 합성 데이터 정책'으로 성능 우위를 입증함(RL Update).
- **정책 변화(RL Update)**: 합성 데이터에 의한 '모델 붕괴(Model Collapse)' 방지 정책이 중요해짐에 따라, 원본 데이터와 합성 데이터의 적절한 혼합 비율 정책과 데이터 다양성 증명 정책이 모델 개발의 필수 과정이 됨.

## 🔗 지식 연결 (Graph)
- [[Computer Vision]], [[Black-Swan]], [[Diffusion-Models]], Simulation, [[Data Distillation (데이터 증류)]]
- **Modern Tech/Tools**: Unity Perception, NVIDIA Omniverse, Stable Diffusion, Blender.
---