- 00_Raw: 회의록 s/t/u/v/w (2026-06-22~24) 추가 - 10_Wiki/Topics: memory(episodes·long_term·distillation), growth 상태, Projects, Digests 갱신 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
18 KiB
[기획서] AI 기반 가상 의상 피팅·커머스 플랫폼 — 내부 실현가능성 검토 (v1.0)
문서 목적: 내부 의사결정용(Go / No-Go / 조건부 Go) 실현가능성 검토 작성일: 2026-06-24 · 타겟 시장: 한국 1차, 글로벌 확장 염두 근거: 2026-06-24 기준 deep-research(22개 소스·100개 주장 추출·25개 적대적 검증) 결과 반영 버전 주의: VTON 분야는 변동이 빠릅니다. 본 문서의 단가·모델 버전은 2026-06-24 스냅샷이며, 사업 확정 전 재확인 필요.
0. 한 장 요약 (Executive Summary)
결론: 조건부 Go (Conditional Go). 기술적·상업적으로 충분히 실현 가능하나, 원래 초안의 "실시간 물리엔진·드레이프 시뮬레이션" 비전은 2026년 현재 비현실적입니다. 이 부분만 현실에 맞게 재정의하면 사업성은 살아 있습니다.
| 항목 | 검토 결과 |
|---|---|
| 기술 실현성 | ✅ 정지 이미지 VTON은 상용 수준 성숙(5 |
| 최단 진입 경로 | ✅ 상용 VTON API 연동(FASHN ~$0.075/회, Kling Kolors $0.07/회) — 상업적 이용권 명시 |
| 자체 개발 | ⚠️ 우수 오픈소스(IDM-VTON·CatVTON 등)는 CC BY-NC-SA 4.0 = 비상업 라이선스라 그대로 상용 불가. 정지 이미지 자체 학습은 의외로 가볍지만, 동영상 자체 개발은 스타트업에 비현실적 |
| 시장 수요 | ✅ 한국에서 실증됨. 에이블리 자체 생성형 AI '옷입기' → 2026년 1~4월 매출 +55%, 콘텐츠 생성 +55%, 이용자 +38% |
| 경쟁 강도 | ⚠️ 구글이 셀카 기반 VTON 출시(진입장벽 낮춤), 에이블리 선점 — 후발 차별화 필요 |
| 규제 리스크 | ⚠️ AI기본법(2026-01-22 시행, 역외적용)·개인정보보호법(생체정보=민감정보) 준수 의무 존재 |
| ROI 핵심 근거 | ❗ 미확정. 전환율 상승·반품률 감소의 신뢰 가능한 외부 수치는 검증에서 기각됨 → 자체 A/B 테스트로 직접 입증 필요 |
핵심 의사결정 메시지: "Fashn.ai처럼 자체 모델로 시작"이 아니라 "상용 API로 6~8주 만에 MVP 출시 → 한국 시장에서 전환율을 직접 측정 → 데이터가 증명되면 그때 자체 모델로 원가 절감" 의 단계적 전략을 강력 권고.
1. 원래 초안 vs 기술 현실 (Reality Check)
당신 초안의 비전을 존중하되, 리서치로 검증된 기술 현실과 대조합니다. 이 표가 이 문서의 가장 중요한 부분입니다.
| 초안의 표현 | 2026년 기술 현실 | 권고 |
|---|---|---|
| "실시간으로 의상을 입힙니다" | 정지 이미지 1장 생성에 5~17초 소요. '실시간(real-time)'은 아님 | "수초 내 결과" 로 기대치 재설정 |
| "재질·드레이프성(찰랑거림)·빛 반사 실시간 렌더링" | 동영상 VTON SOTA(Google Fashion-VDM)도 64프레임 512px 클립에 5~8분. 실시간 스트리밍 가능한 방식 없음(2026 중반 기준) | MVP에서 제외. 정적 이미지 품질에 집중 |
| "Real-time Physics Engine으로 의류 움직임·무게감 계산" | 게임/3D식 물리 드레이프 시뮬레이션은 배포 가능한 상용 VTON 파이프라인으로 존재하지 않음. 현 상용 제품(FASHN·Kling·Google) 전부 확산모델 기반 정지 이미지 | 로드맵 후반 R&D로 강등. MVP 비전에서 삭제 |
| "디지털 트윈 아바타(체형 데이터·3D)" | 체형 입력→3D 아바타→물리 시뮬은 무겁고 미성숙. 현재 주류는 사진 1장→이미지 합성(구글은 셀카 1장이면 충분) | "사진 업로드" 방식으로 단순화. 3D 아바타는 Phase 3+ |
| "스타일 점수 / Mix & Match 레이어링" | 기술적으로 가능(LLM/멀티모달 추천 + 다중 의상 합성). 단, 레이어링은 합성 횟수만큼 추론 비용·시간 누적 | 채택하되 비용 모델에 반영 |
시사점: 초안은 "메타버스/3D 게임형 실시간 피팅"을 상상했지만, 시장이 실제로 굴러가는 방식은 "사진 한 장 올리면 수초 안에 그 옷 입은 내 모습 이미지가 나온다" 입니다. 후자가 더 단순하고, 더 싸고, 이미 한국에서 매출을 내고 있습니다.
2. 사용자 여정 (현실 버전으로 재설계)
초안의 4단계 흐름은 좋습니다. '아바타 생성'을 '사진 업로드'로, '실시간 렌더링'을 '수초 내 이미지 생성'으로 현실화했습니다.
[1. 사진 등록] [2. 의상 선택·가상 피팅] [3. 믹스&매치·추천] [4. 심리스 결제]
전신/반신 사진 1장 → 카탈로그에서 의상 탭 → 상의+하의+아우터 조합 → 사이즈·색상 확인
(또는 셀카 1장, → 수초 내 "입은 내 모습" → AI 스타일 점수/추천 → 즉시 결제
체형 모델 선택 옵션) 이미지 생성(VTON API) (멀티모달 추천 엔진) (입점 브랜드 연동)
| 단계 | 핵심 기능 | 구현 방식(MVP) |
|---|---|---|
| 1. 입력 | 사진 업로드 / 셀카 / 사전 정의 모델 체형 선택 | 자체 UI + 이미지 저장(민감정보 처리 §6) |
| 2. 가상 피팅 | 의상 1종 Try-On | 상용 VTON API 호출(FASHN or Kling) |
| 3. 믹스&매치 | 다중 의상 레이어링 + 스타일 추천 | VTON 다중 호출 + 추천 엔진(룩북/협업필터링) |
| 4. 결제 | 사이즈·색상·재고 확인 → 결제 | 입점 브랜드 상품 DB + PG 연동 |
권고: MVP는 1·2·4단계만. 3단계(믹스&매치·스타일점수)는 v1.1로. 가장 큰 "와우 모먼트"는 2단계 한 방에서 나옵니다.
3. 핵심 기술 확보 전략 (Build vs Buy) — 가장 중요한 의사결정
3-1. 세 가지 옵션 비교
| A. 상용 API 연동 | B. 오픈소스 자체 호스팅 | C. 자체 모델 학습 | |
|---|---|---|---|
| 대표 | FASHN, Kling Kolors | IDM-VTON, CatVTON, OOTDiffusion | CatVTON 방식 파인튜닝 |
| 단가 | $0.07~0.075/회 (대량 시 ~$0.049) | GPU 시간당 비용(추론 최적화 시 저렴) | 학습 후 추론 원가만 |
| 상업 이용 | ✅ 명시적 허용 | ❌ CC BY-NC-SA = 비상업 금지 | ✅ 자체 가중치면 가능 |
| 출시 속도 | 6~8주 | 라이선스 협상 변수 | 3~6개월+ |
| 품질 | 상용 검증됨 | 우수하나 라이선스 막힘 | 데이터·튜닝 역량 의존 |
| 리스크 | API 종속·단가 변동·정책변경 | 라이선스 위반 법적 리스크 | 데이터·인력·시간 |
3-2. 상용 API 단가 (2026-06-24 검증)
- FASHN: $0.075/크레딧(= v1.6 Try-On 1회,
517초). 최소 $7.50(100크레딧). 약정 시 Tier III($1,249/월)에서 $0.0488/회(~35%↓). 상업적 이용 명시. - Kling Kolors Virtual Try-On v1.5(Kuaishou): fal.ai 경유 $0.07/회. "상업용 등급·패션 이커머스 최적화" 명시. 단, 상업 이용 시 kwai-kolors@kuaishou.com 설문 등록 필요.
- IDM-VTON(Replicate 경유): ~$0.024/회 — 단, 모델 자체가 CC BY-NC-SA(비상업) 이므로 상용 사용은 라이선스 위반 소지. 호스팅 단가가 싸 보여도 채택 불가.
3-3. 오픈소스 라이선스 함정 ⚠️ (반드시 인지)
우수 오픈소스 VTON 모델(IDM-VTON, CatVTON)은 모두 CC BY-NC-SA 4.0 = 비상업 전용. 공개 가중치를 그대로 상용 서비스에 탑재하면 라이선스 위반입니다. 커뮤니티 스레드상 저자와 상업 라이선스 협상 여지는 있으나 조건 미확인. "오픈소스니까 공짜로 쓰자"는 함정 — 반드시 법무 검토. 출처: IDM-VTON GitHub/HF 모델카드, CatVTON GitHub LICENSE.
3-4. 자체 학습은 의외로 "정지 이미지"만 가볍다
- 정지 이미지(CatVTON, ICLR 2025): 총 899M 파라미터(학습 가능 49.6M), 추론 <8GB VRAM(1024×768), 512×384에서 2.58초/장. 8×A800에서 ~10시간 파인튜닝, 공개 데이터셋 ~73K 샘플(VITON-HD + DressCode)로 학습 가능. → 스타트업도 도전 가능한 수준.
- 동영상(Google Fashion-VDM): 학습에 1,700만 페어 이미지 + 5.2만 패션 영상(390만 프레임), 16× TPU-v4 약 2주. → 스타트업에 비현실적. 동영상은 당분간 사지도 말고 만들지도 말 것.
3-5. 권고 기술 로드맵
Phase 1 (0~2개월) 상용 API(FASHN 우선, Kling 백업) 연동 → MVP 출시, 종속성 추상화 레이어 설계
Phase 2 (2~6개월) 트래픽·전환 데이터 확보. API 단가 × 월 호출량으로 "자체 전환 손익분기점" 산출
Phase 3 (6~12개월) 손익분기 넘으면 CatVTON식 정지 이미지 자체 모델 학습(자체 데이터로 화질·한국 체형 최적화)
Phase 4 (12개월+) 동영상/3D는 시장·기술 성숙도 재평가 후 R&D 판단 (현재는 보류)
종속성 헷지: 처음부터 VTON 호출을 추상화 인터페이스로 감싸 FASHN ↔ Kling ↔ 자체모델을 코드 변경 없이 교체 가능하게 설계. 단가·정책 급변, 서비스 중단 리스크 대비.
4. 시장 환경 (한국 1차)
4-1. 수요는 한국에서 이미 실증됨 ✅
- 에이블리(Ably): 2025년 7월 자체 개발 생성형 AI 'AI 피팅룸 / AI 옷입기' 출시(사진 1장 등록 → Y2K·오피스·빈티지·스트리트 등 사전 정의 스타일 선택). 2026년 1~4월 매출 +55%, 콘텐츠 생성 횟수 +55%, 이용자 수 +38%(직전 동기 대비).
- 출처: etnews(2025-07-15), 아시아타임(2026-05-13)
- ⚠️ 단, 절대 기준치 미공개의 상대 성장률이며, 전환/반품 인과는 기사에서 직접 주장하지 않음(벤더 우호적 프레이밍 감안).
4-2. 경쟁 지형 ⚠️
- 글로벌: 구글이 셀카 1장 기반 VTON 출시(Nano Banana / Gemini 2.5 Flash Image로 전신 합성). 진입장벽을 "전신 사진"에서 "셀카"로 낮춤 → 소비자 VTON이 주류화. 후발주자는 "기술 신기함"만으로는 차별화 불가.
- 출처: Google 공식 블로그, TechCrunch(2025-12-11)
- 한국 주요 플레이어 VTON 도입 현황: 에이블리는 명확히 선점 확인. 무신사·지그재그·29CM의 VTON/AI 스타일링 도입 강도는 이번 리서치에서 확정 못 함 → 사업 확정 전 별도 경쟁사 정밀 조사 필요(Open Question §8).
4-3. 시장 규모 ❗ (정직한 한계)
검증 과정에서 인용했던 글로벌 가상피팅 시장 규모 수치(Fortune Business Insights: 2025년 68.6억 달러 → 2034년 304억 달러, CAGR 17.7%)는 적대적 검증을 통과하지 못해 기각했습니다. 신뢰 가능한 TAM/CAGR 수치를 이 문서는 제시하지 않습니다. IR/투자용으로 시장 규모가 필요하면, 복수 시장조사기관 원문을 직접 구매·대조하는 별도 작업을 권고합니다.
5. 비즈니스 모델
초안의 3개 수익 모델(판매 수수료 / B2B SaaS / 프리미엄 멤버십)은 타당합니다. 현실 데이터로 우선순위를 조정합니다.
| 모델 | 평가 | 권고 우선순위 |
|---|---|---|
| 판매 수수료(입점 브랜드 결제 수수료) | B2C 커머스의 본류. 단, 결제·물류·CS·재고 등 풀스택 부담 큼 | 중기 |
| B2B SaaS / VTON API·SDK 제공 | 이미 FASHN이 점유 중인 레드오션. 자체 모델 없이 재판매는 마진 압박 | 자체 모델 확보 후 |
| 프리미엄 멤버십(광고 제거·정밀 분석·한정판 우선) | 초기 현금흐름·고관여 유저 확보에 유리 | 단기 |
5-1. 단위 경제성(Unit Economics) 샘플 — 반드시 직접 검증할 가설
⚠️ 아래는 예시 계산입니다. VTON 비용 구조를 감 잡기 위한 것이지 검증된 수치가 아닙니다.
- 가정: 사용자가 구매 1건당 평균 6회 Try-On(여러 옷·조합 시도), API 단가 $0.075/회
- → 구매 1건당 VTON 원가 ≈ $0.45 (약 600원)
- 평균 객단가 5만 원, 입점 수수료 10% = 5,000원/건이라면 → VTON 원가 600원은 수수료의 12%
- 민감 변수: "구매 전환 없이 구경만 하는 Try-On"이 폭증하면 원가가 매출 없이 쌓임 → 무료 Try-On 횟수 제한 / 로그인 게이팅 / 프리미엄 차등이 비용 통제의 핵심 레버.
5-2. ROI 핵심 근거의 공백 ❗
"가상 피팅이 전환율을 올리고 반품률을 낮춘다"는 업계 통념의 신뢰 가능한 외부 수치를 이번 리서치는 확보하지 못했습니다. Zalando의 "사이즈 반품 10% 감소" 주장은 검증에서 기각(0-3)됐고, Walmart/Amazon의 정량 수치도 확정 못 함. → 이 사업의 손익은 "VTON이 전환을 얼마나 올리는가"에 달려 있는데, 그 숫자는 아직 아무도 우리에게 증명해주지 않았습니다. MVP의 1차 목표를 매출이 아니라 "전환율 상승폭의 자체 A/B 측정" 으로 잡을 것을 강력 권고.
6. 리스크 & 규제 (한국)
6-1. 기술 리스크
| 리스크 | 내용 | 완화 |
|---|---|---|
| 의상 종류별 난이도 | 복잡한 패턴·레이어드·드레스·액세서리는 정확도 하락 가능 | MVP는 상의·하의 등 난이도 낮은 카테고리부터 |
| 품질 한계 | 손·로고·텍스트·체형 왜곡 등 확산모델 고질 아티팩트 | 결과물에 "AI 생성·실제와 다를 수 있음" 고지 + 재생성 UX |
| 지연(Latency) | 5~17초 → 다중 조합 시 누적 | 비동기 큐·로딩 UX·캐싱 |
| API 종속 | 단가·정책·중단 리스크 | 추상화 레이어 + 멀티 벤더(§3-5) |
6-2. 규제·법적 리스크 ⚠️ (한국, 역외적용 주의)
- AI기본법(2026-01-22 시행): 생성형 AI 제공자는 ① AI 기반 서비스임을 사전 고지, ② AI 생성물 라벨링 의무. 국외 행위라도 한국 시장·이용자에 영향 시 적용(역외적용).
- 완화: 결과 이미지에 "AI 생성" 라벨·고지 UI 기본 탑재. (단속 유예 ≥1년이나 의무 자체는 현존)
- 개인정보보호법(PIPA): 식별 목적의 얼굴·신체 생체정보 = 민감정보 → 별도 법적 근거·강화된 보안조치 필요. VTON의 얼굴/체형 특징 추출이 여기 해당될 수 있음.
- 완화: 명시적 별도 동의, 업로드 사진 보관 최소화·암호화·자동 파기, 가능하면 추론 후 원본 즉시 삭제. PIPA 과징금은 전체 매출 최대 일정 비율까지 가능하므로 초기부터 법무 설계.
- 출처: Chambers 2026 한국 가이드.
- 저작권/초상권: ① 브랜드 의상 이미지 사용은 입점 계약에 VTON 합성 이용 허락 명문화. ② 타인 사진 업로드 악용 방지(본인 사진·동의 확인).
7. 권고 (Recommendation)
판정: 조건부 Go. 단, 다음 4개 조건을 전제로 한다.
- 비전 재정의: "실시간 3D 물리엔진" → "사진 1장, 수초 내 가상 피팅 이미지". 초안의 물리 시뮬레이션·동영상은 MVP에서 삭제, 로드맵 후반 R&D로 이동.
- Buy-first: 자체 모델이 아니라 상용 API(FASHN 우선)로 6~8주 MVP. 오픈소스 비상업 라이선스 함정 회피. VTON 호출은 추상화 레이어로 감싼다.
- ROI 직접 입증: MVP 1차 KPI = 매출이 아니라 "VTON 노출군 vs 대조군의 전환율 차이" A/B 측정. 이 숫자가 양(+)이어야 자체 모델 투자·B2B 확장의 정당성이 생긴다.
- 컴플라이언스 선설계: AI 라벨링·사전 고지 UI, 생체정보 동의·최소보관·즉시파기 파이프라인을 MVP에 내장(나중에 붙이면 비쌈).
권고 MVP 범위 (6~8주)
- 사진 업로드 → 단일 의상 Try-On(FASHN API) → 결제 연동 → 전환율 A/B 계측
- 제외: 동영상, 3D 아바타, 실시간 물리, 믹스&매치(v1.1로), B2B API(자체모델 후)
단계별 게이트
- Gate 1 (MVP 후 8주): 전환율 상승 유의미 + VTON 원가/매출 비율 < 임계치 → Phase 2 진행
- Gate 2 (월 호출량 기준): API 누적 단가 > 자체 호스팅 손익분기 → CatVTON식 자체 모델 착수
- Gate 3: 한국 PMF 확인 → 글로벌(영어권·구글과 차별점) 확장 판단
8. 미해결 질문 (사업 확정 전 반드시 해소)
- 신뢰 가능한 글로벌 VTON 시장 규모·CAGR — 인용 가능한 수치 부재. 시장조사기관 원문 직접 확보 필요.
- VTON의 실제 전환율 상승·반품률 감소 정량치 — 외부 근거 부재. 자체 A/B로 입증해야 하는 핵심 ROI 질문.
- 오픈소스(IDM-VTON·CatVTON 등) 상업 라이선스 실제 취득 가능 여부·비용 — 협상 여지는 있으나 조건 미확인.
- 무신사·지그재그·29CM의 VTON/AI 스타일링 도입 강도 및 우리 예상 트래픽에서의 build-vs-buy 손익분기점 정밀 산출.
9. 출처 (검증 통과 주장 기준)
- FASHN API 단가: https://help.fashn.ai/plans-and-pricing/api-pricing
- Kling Kolors VTON: https://fal.ai/models/fal-ai/kling/v1-5/kolors-virtual-try-on
- CatVTON(자체 학습 사양): https://github.com/Zheng-Chong/CatVTON, https://arxiv.org/html/2407.15886 (ICLR 2025)
- IDM-VTON 라이선스: https://github.com/yisol/IDM-VTON/blob/main/README.md, https://huggingface.co/yisol/IDM-VTON
- 동영상 VTON 한계(Fashion-VDM): https://arxiv.org/html/2411.00225v2 (SIGGRAPH Asia 2024)
- 에이블리 AI 옷입기 성과: https://www.etnews.com/20250715000270, https://www.asiatime.co.kr/article/20260513500283
- 구글 셀카 VTON: https://blog.google/products-and-platforms/products/shopping/studio-quality-digital-try-on/, TechCrunch(2025-12-11)
- 한국 규제(AI기본법·PIPA): https://practiceguides.chambers.com/practice-guides/data-protection-privacy-2026/south-korea/trends-and-developments
기각된 주장(사용 금지): Zalando "사이즈 반품 10% 감소"(검증 0-3 기각), Fortune Business Insights 시장규모 수치(1-2 기각). 본 문서는 이 둘을 근거로 쓰지 않음.
본 문서는 2026-06-24 deep-research 스냅샷 기반. 단가·모델 버전·규제 시행세칙은 가변적이므로 의사결정 직전 재확인 요망.