Fix: Restore unified Topics folder and reorganize specialized category folders
This commit is contained in:
@@ -0,0 +1,26 @@
|
||||
# [[AI Image Generation Workflow|AI Image Generation Workflow]]
|
||||
|
||||
## 📌 Brief Summary
|
||||
AI 이미지 생성 워크플로우는 사용자의 텍스트 기반 프롬프트를 해석하여 시각적 기호 및 데이터로 변환하는 일련의 과정이다 [1, 2]. 초기 아이디어를 구체적인 주체, 매체, 스타일, 조명 등의 층위로 구조화하여 프롬프트를 작성하는 것에서 출발한다 [2, 3]. 이후 모델별 특성에 맞춰 초기 이미지를 생성하고, 네거티브 프롬프트, 인페인팅(Inpainting), 아웃페인팅(Outpainting) 등을 통해 결과물을 반복적으로 정교화하여 최종 이미지를 완성한다 [4-6].
|
||||
|
||||
## 📖 Core Content
|
||||
* **프롬프트 구조화 (Prompt Structuring)**
|
||||
성공적인 이미지 생성을 위해서는 단순한 단어의 나열이 아닌, 주체(Subject), 매체(Medium), 환경(Environment), 조명(Lighting), 스타일(Style) 및 기술적 매개변수로 이루어진 명확한 계층적 구조가 필요하다 [2, 3, 7, 8]. 피사체에 대한 구체적인 묘사와 함께 렌즈(예: 85mm), 조명(예: 골든 아워, 림 라이팅) 등의 촬영 및 예술적 전문 용어를 사용하면 AI 모델의 제어력을 극대화할 수 있다 [9-11].
|
||||
|
||||
* **플랫폼 특화 워크플로우 (Platform-specific Workflows)**
|
||||
* *미드저니(Midjourney):* 2026년 기준 V7 모델에서는 '드래프트 모드(--draft)'를 활용해 저비용으로 빠르게 다수의 시안을 대량 생성한 뒤, 최적의 구도를 선택하여 고화질(HD)로 업스케일링하는 작업 방식이 효율적이다 [6, 12, 13]. 또한, 일관된 스타일과 서사를 위해 스타일 참조(--sref) 및 옴니 참조(--oref) 매개변수를 적극 활용한다 [14-16].
|
||||
* *DALL-E 3:* 텍스트 지시의 정확한 이행에 강점이 있으며, 사용자가 짧은 프롬프트를 입력해도 ChatGPT가 내부적으로 상세한 합성 캡션(Synthetic Captions)으로 확장하여 이미지를 정교하게 생성한다 [17-20].
|
||||
* *스테이블 디퓨전(Stable Diffusion):* 프롬프트 가중치 조절(예: `(keyword:1.5)`) 기능을 통해 특정 단어의 중요도를 세밀하게 조정하며, 컨트롤넷(ControlNet) 등을 통해 하드웨어 수준의 정밀한 통제력을 발휘하는 것이 특징이다 [21-23].
|
||||
|
||||
* **반복적 정교화 및 후처리 (Iterative Refinement)**
|
||||
이미지 생성 워크플로우는 첫 번째 생성에서 끝나지 않고 모델과의 반복적인 협업 과정으로 이어진다 [4, 5, 24].
|
||||
* **네거티브 프롬프트 (Negative Prompts):** 원치 않는 요소나 시각적 결함(예: 일그러진 손가락, 워터마크)이 발생하면 이를 네거티브 프롬프트에 명시적으로 추가하여 제거한다 [23, 25-27].
|
||||
* **부분 수정 및 시야 확장:** 미드저니의 'Vary (Region)'과 같은 인페인팅 기능을 사용해 이미지의 전체적인 맥락을 유지한 채 특정 영역(예: 인물의 모자)만 수정하거나, 'Zoom Out(아웃페인팅)'을 통해 캔버스 밖의 배경을 자연스럽게 확장한다 [5, 28-30].
|
||||
|
||||
## 🔗 Knowledge Connections
|
||||
- **Related Topics:** [[Prompt Engineering|Prompt Engineering]], [[Negative Prompts|Negative Prompts]], [[Image Parameters|Image Parameters]], [[Inpainting & Outpainting|Inpainting & Outpainting]]
|
||||
- **Projects/Contexts:** [[Midjourney V7 Draft Mode|Midjourney V7 Draft Mode]], [[DALL-E 3 Synthetic Captioning|DALL-E 3 Synthetic Captioning]]
|
||||
- **Contradictions/Notes:** DALL-E 3는 "no", "without"과 같은 부정형 지시어를 잘 이해하지 못해 오히려 해당 객체를 생성할 위험이 있으므로 모든 지시를 긍정형 문장으로 우회해야 하는 반면 [20, 31], 스테이블 디퓨전은 구조화된 네거티브 프롬프트 섹션을 통해 워터마크나 신체 왜곡 등의 결함을 적극적으로 차단해야 한다는 점에서 플랫폼별 대응 방식에 뚜렷한 차이가 존재한다 [23, 26, 32].
|
||||
|
||||
---
|
||||
*Last updated: 2026-04-30*
|
||||
Reference in New Issue
Block a user