chore(wiki): reinforce knowledge batch #6-#10 (200 docs milestone)

This commit is contained in:
Antigravity Agent
2026-04-26 15:07:47 +09:00
parent f541717fe1
commit c612160a13
265 changed files with 8026 additions and 1113 deletions
+16 -19
View File
@@ -1,31 +1,28 @@
---
id: P-REINFORCE-AUTO-DIMO-001
id: DIFFUSION-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.98
tags: [auto-reinforced, diffusion-models, generative-ai, computer-vision, image-generation, denoiser]
last_reinforced: 2026-04-20
confidence_score: 1.0
tags: [ai, generative-model, diffusion-model, image-generation, deep-learning]
last_reinforced: 2026-04-26
---
# [[Diffusion-Models]]
# [[Diffusion Models (확산 모델)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "파괴에서 창조를 얻다: 선명한 이미지에 노이즈를 섞어 형체를 없애는 과정(Forward)을 거꾸로 학습하여, 아무 의미 없는 노이즈로부터 환상적인 고해상도 이미지를 조각해내는 현대 이미지 생성 AI의 핵심 엔진."
> "혼돈(Noise) 속에서 질서를 찾아내어 무(無)에서 유(有)를 창조하라" — 데이터에 노이즈를 점진적으로 추가했다가 이를 다시 제거하과정(Denoising)을 학습하여, 단순한 노이즈로부터 고품질의 이미지나 데이터를 생성하는 최신 생성 모델.
## 📖 구조화된 지식 (Synthesized Content)
확산 모델(Diffusion-Models)은 데이터를 노이즈로 변환한 후, 이 과정을 역전시켜 데이터를 생성하는 확률론적 생성 모델입니다.
1. **핵심 프로세스**:
* **Forward Diffusion**: 고양이 이미지에 가우시안 노이즈를 단계적으로 추가하여 완전한 노이즈로 만듦.
* **Reverse Diffusion (Denosing)**: 노이즈에서 원래 이미지를 복구하는 신경망(U-Net 등)을 학습.
* **Conditioning**: 텍스트 프롬프트를 입력하면 그 의미에 맞는 방향으로 노이즈를 제거하여 원하는 결과 도출.
2. **장점**:
* GAN(Generative Adversarial Networks)보다 학습이 안정적이고, 훨씬 더 세밀하고 다양한 결과물을 생성함.
- **추출된 패턴:** 정규 분포를 따르는 무작위 노이즈에서 시작하여, 모델이 학습한 데이터의 분포를 따라 미세한 패턴을 복원해나가는 반복적 정제(Iterative Refinement) 패턴.
- **작동 원리:**
- **Forward Process:** 데이터에 가우시안 노이즈를 단계적으로 추가하여 완전한 노이즈 상태로 만듦.
- **Reverse Process (Denoising):** 각 단계에서 추가된 노이즈를 예측하고 제거하여 원래 데이터를 복구하도록 모델을 학습.
- **Sampling:** 학습된 모델을 사용해 순수 노이즈로부터 한 단계씩 노이즈를 걷어내며 새로운 데이터 생성.
- **의의:** GAN의 학습 불안정성 문제를 해결하고, 압도적인 데이터 생성 품질과 다양성을 확보하여 Midjourney, Stable Diffusion 등의 기반 기술이 됨.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거 이미지 생성 정책은 수만 장의 사진을 단순히 모사하는 정책이었으나, 확산 모델 정책은 데이터의 '확률 분포 밀도 정책'을 학습하여 세상에 없는 완벽한 구상을 만들어냄(RL Update).
- **정책 변화(RL Update)**: 이미지 생성 정책을 넘어 비디오(Sora), 3D 모델링, 단백질 구조 설계 정책 등 모든 물리적 데이터 생성 정책의 표준으로 확산 중임.
- **과거 데이터와의 충돌:** GAN이 생성 모델의 정답으로 여겨지던 시대를 지나, 더 안정적이고 고성능인 확산 모델이 이미지/비디오 생성의 새로운 표준으로 자리 잡음.
- **정책 변화:** Antigravity 프로젝트는 위키 문서의 시각화 보조 자료나 목업 이미지 생성할 때 최신 확산 모델 기반의 API를 활용하여 고품질 결과물을 생성함.
## 🔗 지식 연결 (Graph)
- [[Gen-AI]], [[Computer Vision]], [[CV_Synthesis]], [[Computational Creativity]], [[Statistics & Data Analysis]]
- **Modern Tech/Tools**: Stable Diffusion, Midjourney, DALL-E 3, ControlNet.
---
- [[Generative-Adversarial-Networks-GAN]], [[Variational-Autoencoders-VAE]], [[CLIP]], [[Computer-Vision-Mastery]]
- **Raw Source:** [[10_Wiki/Topics/AI/Diffusion-Models.md]]