20 lines
4.0 KiB
Markdown
20 lines
4.0 KiB
Markdown
# [[Diffusion Models]]
|
|
|
|
## 📌 Brief Summary
|
|
디퓨전 모델(Diffusion Models)은 무작위 노이즈에서 시작하여 점진적으로 노이즈를 제거(denoising)함으로써 사용자가 입력한 텍스트 프롬프트에 부합하는 고품질의 새로운 이미지를 생성하는 생성형 AI 아키텍처이다 [1, 2]. 모델은 데이터에 가우시안 노이즈를 추가하는 순방향 과정과 이를 역으로 복원하는 역방향 과정을 학습하여 작동한다 [2, 3]. 이 반복적인 생성 메커니즘 덕분에 프롬프트 엔지니어는 매개변수를 활용하여 생성의 여러 단계에서 결과물을 세밀하게 제어할 수 있다 [2].
|
|
|
|
## 📖 Core Content
|
|
* **작동 원리 (순방향 및 역방향 확산):** 디퓨전 모델은 훈련 시 원본 데이터에 점진적으로 가우시안 노이즈를 다단계로 추가하여 순수 노이즈 상태로 저하시키는 '순방향 확산 과정(Forward Diffusion Process)'을 거친다 [3]. 이후 모델은 노이즈 추가 과정을 체계적으로 역전시켜 원본 입력을 재구성하는 '역방향 확산(Reverse Diffusion)'을 학습한다 [2]. 실제 이미지를 생성할 때는 텍스트 프롬프트를 데이터로 변환한 뒤, 무작위 노이즈에서 출발해 학습된 노이즈 제거 단계를 반복적으로 적용하며 텍스트 지시와 일치하는 최종 이미지를 점진적으로 형성한다 [1, 2].
|
|
* **장점 및 한계:** 디퓨전 모델은 다양하고 정교한 고품질 이미지 샘플을 생성하는 데 탁월하며, 적대적 신경망(GAN)에 비해 훈련 과정이 매우 안정적이다 [2]. 특히 반복적인 생성 과정은 작업자가 최종 출력물을 픽셀 단위로 세밀하게 제어(Fine-Grained Control)할 수 있게 해준다 [2]. 그러나 이러한 노이즈 제거 과정으로 인해 계산 집약적이며 생성 속도가 상대적으로 느리고, 초보자가 하드웨어 수준에서 직접 로컬에 배포하고 구성하기 복잡하다는 단점이 있다 [4].
|
|
* **이미지 프롬프트 작성과의 직접적 연관성:**
|
|
* 미드저니(Midjourney)나 스테이블 디퓨전(Stable Diffusion)과 같은 오늘날의 선도적인 텍스트-투-이미지(Text-to-Image) 도구들은 모두 디퓨전 모델을 기반으로 작동한다 [1, 3, 5].
|
|
* 프롬프트 작성 시 이러한 디퓨전 메커니즘을 이해하면 결과물을 더 효과적으로 제어할 수 있다. 예를 들어, 미드저니에서는 `--stop` 매개변수를 사용해 이미지 렌더링 과정을 중간에 멈출 수 있는데, 이를 통해 디퓨전 프로세스의 흐름을 파악하거나 의도적으로 불완전하고 흐릿한 예술적 결과를 얻을 수 있다 [1, 6].
|
|
* 스테이블 디퓨전에서 네거티브 프롬프트(Negative Prompt)는 단순히 완성된 이미지를 필터링하는 것이 아니라, 생성 중 노이즈 제거 경로(denoising path)에 영향을 주어 원치 않는 개념으로부터 디퓨전 프로세스를 멀어지게 하는 필수적인 가이드 시스템으로 작동한다 [7, 8]. 연구에 따르면 네거티브 프롬프트의 영향력은 초기보다는 특정 디퓨전 단계(예: step 10) 이후에 주로 나타나므로, 프롬프트 입력과 가중치 조절 시 이 프로세스적 특징을 고려해야 한다 [9].
|
|
|
|
## 🔗 Knowledge Connections
|
|
- **Related Topics:** [[Negative Prompts]], [[Stable Diffusion]], [[Midjourney]]
|
|
- **Projects/Contexts:** [[AI Image Generation Workflow]], [[Parameter Control]]
|
|
- **Contradictions/Notes:** 소스 문헌에 따르면 디퓨전 모델은 고품질의 세밀한 제어가 가능하고 훈련이 안정적이라는 훌륭한 강점이 있으나, 생성 속도가 빠른 GAN 등 다른 생성 모델 아키텍처에 비해 컴퓨팅 자원 소모가 크고 반복적인 노이즈 제거(denoising) 과정 때문에 생성 시간이 더 오래 걸린다는 근본적인 트레이드오프(trade-off)가 존재한다 [2, 4].
|
|
|
|
---
|
|
*Last updated: 2026-04-30* |