"매 content + style separation의 art". Gatys et al. (2015) 가 VGG feature space 의 Gram matrix 로 style 추출 → 매 content image 에 transfer 의 seminal work. 2026 의 modern state 는 diffusion-based (IP-Adapter, ControlNet style) + Midjourney --sref 의 mainstream.
매 핵심
매 origin (Gatys 2015)
VGG-19 의 conv layer activation 의 feature representation.
Content loss: 매 high-level layer (conv4_2) 의 feature MSE.
Style loss: 매 multiple layer 의 Gram matrix (feature correlation) MSE.
Optimization-based — 매 image pixel 자체 의 gradient descent (slow, ~minutes per image).
매 evolution
Fast NST (Johnson 2016): feedforward network 의 single forward pass.
AdaIN (Huang 2017): Adaptive Instance Normalization — 매 arbitrary style 의 real-time.
Diffusion-based (2023+): IP-Adapter, ControlNet — 매 prompt + reference 의 zero-shot.
매 응용
Artistic image generation (Prisma, DeepArt — 매 historical).
Midjourney --sref / --cref — 매 mainstream creative tool.
언제: 매 creative pipeline 의 style consistency, brand asset variant 생성, mood board 의 visual exploration.
언제 X: 매 photo retouching (use Lightroom), 매 strict color grading (use LUTs), 매 face identity preservation 의 unstable.
❌ 안티패턴
Style weight 무한 증가: 매 content 가 사라짐. balance 필수 (1e6 typical).
Single VGG layer: 매 multi-scale style 의 lost. 매 multiple layer aggregate.
Diffusion 의 prompt 무시: IP-Adapter scale 너무 높으면 prompt 의 무시. scale 0.5-0.8 sweet spot.
🧪 검증 / 중복
Verified (Gatys et al. 2015 "A Neural Algorithm of Artistic Style"; Huang & Belongie 2017 AdaIN; Ye et al. 2023 IP-Adapter).