19 lines
4.5 KiB
Markdown
19 lines
4.5 KiB
Markdown
# [[Stable Diffusion Image Optimization|Stable Diffusion Image Optimization]]
|
|
|
|
## 📌 Brief Summary
|
|
스테이블 디퓨전(Stable Diffusion) 이미지 최적화는 프롬프트 가중치 조절, 부정 프롬프트(Negative prompt)의 전략적 활용, 그리고 컨트롤넷([[ControlNet|ControlNet]])과 같은 고급 제어 기술을 통해 AI 이미지 생성의 품질과 정밀도를 극대화하는 과정입니다. 사용자는 문장 형태가 아닌 쉼표로 구분된 태그 방식과 특수한 기호 문법을 통해 모델이 특정 단어에 부여하는 중요도를 세밀하게 조정할 수 있습니다. 이를 통해 반복 생성(reroll)에 드는 시간을 절약하고 모델의 편향을 제어하여 원하는 예술적 결과물을 일관되게 얻을 수 있습니다.
|
|
|
|
## 📖 Core Content
|
|
* **프롬프트 가중치(Prompt Weights) 제어**: 스테이블 디퓨전에서 사용자의 의도를 가장 정확하게 반영하는 방법은 프롬프트 단어들의 가중치를 조절하는 것입니다 [1]. 프롬프트는 완전한 문장보다는 쉼표로 구분된 태그의 나열이 효과적이며, 높은 품질을 나타내는 태그(예: masterpiece, best quality)로 시작하는 것이 좋습니다 [2]. 특정 단어 뒤에 괄호와 수치를 적용하여 중요도를 조절할 수 있는데, 기본값 1을 기준으로 1.1~2.0은 해당 요소의 강조를, 0~0.9는 약화를 의미합니다 [3]. `(keyword:factor)` 형태의 숫자 입력뿐만 아니라 `(keyword)+`나 `(keyword)-`와 같이 기호를 사용한 중첩 적용도 가능합니다 [1, 4]. 단어의 가중치뿐만 아니라 프롬프트 내에 단어가 배치된 순서 자체도 결과물에 큰 영향을 미칩니다 [5].
|
|
* **네거티브 프롬프트(Negative Prompt)의 전략적 활용**: 포지티브 프롬프트가 이미지의 '목표 지점'을 설명한다면, 네거티브 프롬프트는 모델이 빠지기 쉬운 실패 패턴을 차단하는 '회피 지도(avoidance map)' 역할을 수행합니다 [6]. 단순히 "나쁜(bad)"과 같은 모호한 단어를 나열하기보다는 이미지를 분석하여 "여섯 개의 손가락(extra fingers)", "비대칭 눈(asymmetrical eyes)", "워터마크(watermark)" 등 구체적인 결함 요소를 명시해야 모델의 편향을 효과적으로 억제할 수 있습니다 [7, 8]. 네거티브 프롬프트에도 가중치를 부여하여 특정 결함을 더욱 강하게 차단하는 것이 가능합니다 [9, 10].
|
|
* **CFG 스케일 및 파라미터 튜닝**: CFG 스케일(Classifier-Free Guidance Scale)은 생성되는 이미지가 사용자가 입력한 프롬프트 지시를 얼마나 강력하게 따를지 결정하는 안내 강도입니다 [6, 11]. 일반적으로 7에서 15 사이의 값이 권장됩니다 [12]. 네거티브 프롬프트를 명확하게 작성하지 않은 상태에서 CFG 스케일만 높이면 오히려 잘못된 지시사항이나 편향을 더 강하게 따르게 되므로, 프롬프트와 파라미터 간의 균형이 중요합니다 [13].
|
|
* **컨트롤넷(ControlNet)을 통한 픽셀 단위 통제**: 스테이블 디퓨전은 텍스트 프롬프트의 한계를 넘어선 하드웨어 수준의 제어를 제공합니다. 컨트롤넷을 활용하면 이미지의 뼈대(Pose)나 윤곽선(Canny Edge) 정보를 강제로 주입하여 인체의 자세나 사물의 배치를 픽셀 단위로 통제할 수 있습니다 [1].
|
|
|
|
## 🔗 Knowledge Connections
|
|
- **Related Topics:** 프롬프트 가중치 문법(Prompt Weights Syntax, 네거티브 프롬프트(Negative Prompt), CFG 스케일(CFG Scale), [[컨트롤넷 (ControlNet)|컨트롤넷(ControlNet]]
|
|
- **Projects/Contexts:** 오픈소스 이미지 생성 파이프라인 및 미세 조정(Fine-tuning) 워크플로우
|
|
- **Contradictions/Notes:** 가중치를 낮추거나 부정적인 의미를 부여하는 문법 기호에 대해 소스 간 설명의 차이가 있습니다. 특정 가이드에서는 대괄호 `[]`나 `-` 기호가 가중치를 0.9배로 약화시키는 역할을 한다고 명시하지만 [1, 3], 다른 시스템(Graydient AI 등)의 파서 규칙에 따르면 대괄호 `[]`는 네거티브 프롬프트로 작동하며, 단순히 숫자를 낮추는 것과 명시적인 네거티브 프롬프트를 사용하는 것은 기술적으로 다른 결과를 낳는다고 조언합니다 [14, 15]. 따라서 사용 중인 UI나 파서 버전에 맞는 정확한 문법 확인이 필요합니다.
|
|
|
|
---
|
|
*Last updated: [[2026-04-30|2026-04-30]]*
|