docs: finalized wiki integrity maintenance (v3.0 standard) - pruned 1400+ stubs and fixed 11k+ ghost links
This commit is contained in:
@@ -1,4 +1,4 @@
|
||||
# [[AI 이미지 생성 파이프라인]]
|
||||
# [[AI 이미지 생성 파이프라인|AI 이미지 생성 파이프라인]]
|
||||
|
||||
## 📌 Brief Summary
|
||||
AI 이미지 생성 파이프라인은 사용자가 입력한 텍스트 프롬프트나 기존 이미지를 기계가 해석 가능한 데이터로 변환하여 시각적 결과물을 만들어내는 과정이다 [1, 2]. 이 과정의 핵심은 추상적인 텍스트 기호를 잠재 공간(Latent Space)의 구체적 좌표로 매핑하여 픽셀 단위로 구현하는 것이다 [2]. 주로 확산 모델(Diffusion Models), 생성적 적대 신경망(GANs), 변분 자동인코더(VAEs) 등의 기계 학습 아키텍처를 기반으로 작동하며, 특히 확산 모델은 무작위 노이즈에서 시작해 점진적으로 노이즈를 제거하며 사용자의 의도에 맞는 이미지를 형성한다 [3-6].
|
||||
@@ -17,8 +17,8 @@ AI 이미지 생성 파이프라인은 사용자가 입력한 텍스트 프롬
|
||||
최신 AI 이미지 생성 파이프라인은 단발성 생성에서 '연속적 창작 워크플로우'로 진화했다 [13]. 미드저니 V7의 드래프트 모드(Draft Mode)처럼 저비용·초고속으로 대량의 시안을 생성한 뒤 최적의 결과물을 고화질로 승격시키는 설계가 도입되었다 [13-15]. 더 나아가 생성된 정적 이미지를 비디오로 변환하는 단계까지 파이프라인이 매끄럽게 연결되며, 스타일 참조(--sref) 및 객체 참조(--oref) 기능을 통해 파이프라인 전반에 걸쳐 미학적 일관성을 유지할 수 있게 되었다 [13, 14, 16, 17].
|
||||
|
||||
## 🔗 Knowledge Connections
|
||||
- **Related Topics:** [[Diffusion Models]], [[Latent Space]], [[Prompt Engineering]], [[Negative Prompt]]
|
||||
- **Projects/Contexts:** [[Midjourney V7/V8 Alpha]], [[DALL-E 3]], [[Stable Diffusion]]
|
||||
- **Related Topics:** [[Diffusion Models|Diffusion Models]], Latent Space, [[Prompt Engineering|Prompt Engineering]], [[Negative Prompt|Negative Prompt]]
|
||||
- **Projects/Contexts:** Midjourney V7/V8 Alpha, [[DALL-E 3|DALL-E 3]], [[Stable Diffusion|Stable Diffusion]]
|
||||
- **Contradictions/Notes:** 소스 39와 17에서는 미드저니(Midjourney) 파이프라인이 매개변수(Parameter)를 통한 수치 제어 및 고유의 예술적 개입에 의존한다고 설명하는 반면, 소스 20 및 21에서는 DALL-E 3의 파이프라인이 매개변수 대신 자연어에 크게 의존하며 GPT-4가 사용자의 프롬프트를 자동으로 상세하게 확장(Expansion)하여 이미지를 생성한다고 분석하여 플랫폼 간의 프롬프트 처리 파이프라인 설계에 차이가 있음을 보여준다 [18-20].
|
||||
|
||||
---
|
||||
|
||||
Reference in New Issue
Block a user