32 lines
2.4 KiB
Markdown
32 lines
2.4 KiB
Markdown
---
|
|
id: P-REINFORCE-AUTO-DCGN-001
|
|
category: "10_Wiki/💡 Topics/AI"
|
|
confidence_score: 0.94
|
|
tags: [auto-reinforced, dcgan, generative-adversarial-networks, computer-vision, deep-learning, image-generation, cnn]
|
|
last_reinforced: 2026-04-20
|
|
---
|
|
|
|
# [[Deep-Convolutional-GANs|Deep-Convolutional-GANs]]
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> "눈을 가진 생성기: 초기 GAN의 불안정성을 합성곱 신경망(CNN) 구조로 극복하여, AI가 픽셀의 단순 조합을 넘어 사물의 기하학적 형태와 질감을 이해하고 진짜 같은 이미지를 그려내게 만든 현대 생성 AI의 선조."
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
DCGAN(Deep-Convolutional-GANs)은 GAN 아키텍처에 CNN을 도입하여 이미지 생성 성능을 획기적으로 개선한 모델입니다. (Alec Radford 등이 2015년 발표)
|
|
|
|
1. **아키텍처 혁신**:
|
|
* **Strided Convolutions**: 풀링(Pooling) 대신 스트라이드 합성곱을 사용하여 공간 정보를 보존하면서 차원을 조절.
|
|
* **Batch Normalization**: 생성자와 판별자 모두에 적용하여 학습 초기의 불안정성 해소. (Reliability와 연결)
|
|
* **Activation Functions**: 생성자에는 ReLU와 Tanh 사용, 판별자에는 LeakyReLU 사용.
|
|
2. **의의**:
|
|
* 특징 공간(Feature Space) 상의 '벡터 산술 연산'을 통해 안경 쓴 남성 - 남성 + 여성 = 안경 쓴 여성 같은 고차원 개념 조작이 가능함을 증명함. (Representation-Learning와 연결)
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
|
- **과거 데이터와의 충돌**: 과거 GAN 정책은 학습이 매우 어려워 '운'에 의존하는 경과 정책(Mode collapse)이 잦았으나, DCGAN 정책은 검증된 아키텍처 정책 가이드라인을 제시하여 누구나 안정적인 생성 정책이 가능하게 함(RL Update).
|
|
- **정책 변화(RL Update)**: 현재는 확산 모델(Diffusion Models) 정책에 밀려 주류에서 물러났으나, 실시간 이미지 변환 정책이나 특정 도메인 데이터 증강 정책 등에서는 여전히 효율적인 선택지로 쓰임.
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- [[Representation-Learning|Representation-Learning]], [[Reliability|Reliability]], Deep Learning (DL), [[Feature-Engineering|Feature-Engineering]], [[Research|Research]]
|
|
- **Key Milestones**: Vector Arithmetic in Feature Space.
|
|
---
|