Files
2nd/10_Wiki/Topics/CV_Synthesis.md
T
2026-05-02 23:33:34 +09:00

2.5 KiB


id: P-Reinforce-AUTO-CVSY-001 category: Unified confidence_score: 0.92 tags: [auto-reinforced, cv-synthesis, Computer-Vision, Synthetic-Data, image-generation, computer-graphics] last_reinforced: 2026-04-20

CV_Synthesis

📌 한 줄 통찰 (The Karpathy Summary)

"가상의 눈을 위한 가상의 데이터: 실제 촬영 없이도 컴퓨터 그래픽스와 AI를 이용해 완벽하게 라벨링된 대규모 학습 데이터를 생성함으로써, 컴퓨터 비전 모델 개발의 높은 비용과 데이터 부족 문제를 해결하는 지능형 제조 공정."

📖 구조화된 지식 (Synthesized Content)

컴퓨터 비전 합성(CV_Synthesis)은 가상의 환경에서 인공적인 이미지나 비디오 데이터를 생성하여 모델을 학습시키는 기술입니다.

  1. 필요성:
    • Perfect Ground Truth: 합성 데이터는 객체의 위치, 각도, 픽셀 단위 마스크 정보를 오차 없이 자동으로 가짐.
    • Rare Events: 도로 위 사고 상황 등 실제로 수집하기 어려운 희귀 사례(Black-Swan)를 무한히 생성 가능. (Black-Swan과 연결)
    • Privacy: 실제 사람의 얼굴이나 번호판을 쓰지 않아도 되므로 개인정보 보호 이슈에서 자유로움.
  2. 핵심 기술:
    • Sim-to-Real: 가상 세계(Simulator)와 실제 세계 간의 차이(Domain Gap)를 줄이기 위한 도메인 적응 기술.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 합성 데이터가 너무 '가짜 티'가 나서 성능 저하를 유발한다는 정책적 우려가 컸으나, 현대 정책은 확산 모델(Diffusion)이나 렌더링 최적화(Gaussian Splatting)를 통한 '극사실주의 합성 데이터 정책'으로 성능 우위를 입증함(RL Update).
  • 정책 변화(RL Update): 합성 데이터에 의한 '모델 붕괴(Model Collapse)' 방지 정책이 중요해짐에 따라, 원본 데이터와 합성 데이터의 적절한 혼합 비율 정책과 데이터 다양성 증명 정책이 모델 개발의 필수 과정이 됨.

🔗 지식 연결 (Graph)