f8b21af4be
10_Wiki/Topics 대규모 정리: - 오류 캡처/미완성 stub 문서 227개 제거 - 교차폴더 중복 43클러스터 병합 (63파일 → redirect) - 링크명 정규화: 깨진 링크 수정·redirect 직결·개념 매핑 ~2,400건 - 카테고리 MOC 6개 신규 생성 - Graph 섹션 미해결 related-keyword 링크 10,058건 제거 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
103 lines
5.4 KiB
Markdown
103 lines
5.4 KiB
Markdown
---
|
|
id: wiki-2026-0507-009
|
|
title: AI 이미지 생성 워크플로우
|
|
category: 10_Wiki/Topics
|
|
status: verified
|
|
canonical_id: self
|
|
aliases: [wiki-2026-0507-009, AI Image Generation Workflow, 이미지 생성 워크플로우, AI 이미지 파이프라인, DALL-E 3, Midjourney, Stable Diffusion]
|
|
duplicate_of: none
|
|
source_trust_level: B
|
|
confidence_score: 1.0
|
|
tags: [AI, Image Generation, Workflow, Midjourney, Stable Diffusion, DALL-E 3]
|
|
raw_sources: [직접 입력]
|
|
last_reinforced: 2026-05-07
|
|
github_commit: pending
|
|
---
|
|
|
|
# AI_이미지_생성_워크플로우
|
|
|
|
## 📌 한 줄 통찰 (The Karpathy Summary)
|
|
> AI 이미지 생성은 단판 승부가 아닌, '초기 시안 탐색 -> 반복적 정교화 -> 부분 수정 및 확장'으로 이어지는 점진적이고 계층적인 워크플로우의 결과물이다. 모델마다 다른 언어적 이해도와 기술적 매개변수를 정확히 활용하는 것이 프로페셔널 생성의 핵심이다.
|
|
|
|
---
|
|
|
|
## 📖 구조화된 지식 (Synthesized Content)
|
|
**추출된 패턴:**
|
|
> 생성의 80%는 핵심 피사체와 구도를 잡는 초기 프롬프트에서 결정되며, 나머지 20%의 완성도는 부정 프롬프트 제어와 인페인팅/아웃페인팅 기술을 통한 미세 조정에서 완성된다. DALL-E 3는 자연어 설명 중심, Midjourney/SD는 기술적 매개변수 중심의 전략을 취한다.
|
|
|
|
**세부 내용:**
|
|
- **모델별 특화 전략:**
|
|
- **DALL-E 3:**
|
|
- GPT-4 기반의 고도화된 자연어 이해력을 활용.
|
|
- 프롬프트를 문장 형태로 상세히 기술할수록 의도가 정확히 반영됨.
|
|
- 의도가 왜곡될 경우 "Prompt exactly: [본래 프롬프트]"를 사용하여 모델의 자동 확장을 억제.
|
|
- **Midjourney:**
|
|
- `--ar` (가로세로비), `--stylize` (스타일 강도), `--chaos` (다양성) 등 매개변수 중심의 제어.
|
|
- `--sref` (Style Reference) 및 `--cref` (Character Reference)를 통한 이미지 일관성 유지.
|
|
- **Stable Diffusion (SD):**
|
|
- LoRA, ControlNet 등 외부 모듈을 통한 결정론적(Deterministic) 제어.
|
|
- 긍정/부정 프롬프트의 가중치 조절을 통한 픽셀 단위의 미세 조정.
|
|
- **반복적 정교화 (Iterative Prompting):**
|
|
- 넓고 모호한 지시에서 시작해 구체적인 지시로 좁혀나가는 방식.
|
|
- 3~5번의 변형(Variation)을 통해 세부 사항을 다듬음.
|
|
- **사후 편집 기술:**
|
|
- **Inpainting (Vary Region):** 원본 맥락을 유지하며 특정 부분만 수정/추가.
|
|
- **Outpainting (Zoom/Pan):** 캔버스 바깥 공간 확장 및 구도 재구성.
|
|
- **계층적 프롬프트 구조:** 주체(Subject) -> 맥락(Context) -> 스타일(Style) -> 기술적 세부사항(Technical) 순의 논리적 배치.
|
|
|
|
---
|
|
|
|
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
|
|
**언제 이 지식을 쓰는가:**
|
|
- 상업적 수준의 고품질 이미지를 생성해야 할 때.
|
|
- 여러 장의 이미지를 하나의 프로젝트나 시리즈로 일관되게 제작해야 할 때.
|
|
- 생성 결과가 마음에 들지 않아 처음부터 다시 시작하는 대신 효율적으로 수정하고 싶을 때.
|
|
|
|
**언제 이 지식을 쓰면 안 되는가:**
|
|
- 단순 재미 위주의 일회성 생성이며, 결과의 정밀도가 중요하지 않을 때.
|
|
|
|
**이 지식을 적용할 때의 권장 절차:**
|
|
1. **모델 선택:** 의도가 복잡하면 DALL-E 3, 미적 퀄리티와 일관성이 중요하면 Midjourney, 정밀 제어가 필요하면 SD 선택.
|
|
2. **시안 탐색:** 간결한 프롬프트로 4~8개의 초기 시안 생성.
|
|
3. **선택 및 변형:** 가장 나은 시안을 골라 세부 키워드 추가 및 매개변수 조절.
|
|
4. **결함 제거:** 부정 프롬프트를 사용하여 시각적 결함 차단 (SD/Midjourney 필수).
|
|
5. **최종 리터칭:** 인페인팅/아웃페인팅으로 특정 부위 보정 및 구도 확장.
|
|
|
|
**주의사항 또는 알려진 한계:**
|
|
- 모델마다 부정어 처리 능력이 다르므로(SD는 강력, DALL-E 3는 취약), 플랫폼 특성에 맞는 전략 선택이 필수적임.
|
|
|
|
---
|
|
|
|
## 🧪 검증 상태 (Validation)
|
|
- **정보 상태:** verified
|
|
- **출처 신뢰도:** B
|
|
- **검토 이유:** 해당 없음
|
|
|
|
---
|
|
|
|
## 🧬 중복 검사 (Duplicate Check)
|
|
- **기존 유사 문서:** [[AI Image Generation Workflow]], [[DALL-E 3]], [[DALL-E 3 대화형 프롬프트 생성]], [[AI 이미지 생성 도구 및 매개변수]], [[AI 이미지 생성 파이프라인]] 등
|
|
- **처리 방식:** UPDATE
|
|
- **처리 이유:** 이미지 생성 프로세스와 관련된 중복 문서들을 통합하여 DALL-E 3까지 아우르는 하나의 완성된 파이프라인 가이드로 강화함.
|
|
|
|
---
|
|
|
|
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
|
|
- **과거 데이터와의 충돌:** 없음
|
|
- **정책 변화:** 단순 생성을 넘어 '드래프트-업스케일-편집'으로 이어지는 전문가용 워크플로우를 표준으로 설정.
|
|
|
|
---
|
|
|
|
## 🔗 지식 연결 (Graph)
|
|
- **Parent:** [[10_Wiki/Topics]]
|
|
- **Related:** , [[미드저니_매개변수_제어]]
|
|
- **Raw Source:** 직접 입력
|
|
|
|
---
|
|
|
|
## 🕓 변경 이력 (Changelog)
|
|
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|
|
|------|-----------|-----------|--------|
|
|
| 2026-05-07 | DALL-E 3 및 도구별 상세 파라미터 활용법 통합 업데이트 | UPDATE | B |
|
|
|