Files
2nd/10_Wiki/Topics_Blog/Stable Diffusion Image Optimization.md
T

4.5 KiB

Stable Diffusion Image Optimization

📌 Brief Summary

스테이블 디퓨전(Stable Diffusion) 이미지 최적화는 프롬프트 가중치 조절, 부정 프롬프트(Negative Prompt)의 전략적 활용, 그리고 컨트롤넷(ControlNet)과 같은 고급 제어 기술을 통해 AI 이미지 생성의 품질과 정밀도를 극대화하는 과정입니다. 사용자는 문장 형태가 아닌 쉼표로 구분된 태그 방식과 특수한 기호 문법을 통해 모델이 특정 단어에 부여하는 중요도를 세밀하게 조정할 수 있습니다. 이를 통해 반복 생성(reroll)에 드는 시간을 절약하고 모델의 편향을 제어하여 원하는 예술적 결과물을 일관되게 얻을 수 있습니다.

📖 Core Content

  • 프롬프트 가중치(Prompt Weights) 제어: 스테이블 디퓨전에서 사용자의 의도를 가장 정확하게 반영하는 방법은 프롬프트 단어들의 가중치를 조절하는 것입니다 [1]. 프롬프트는 완전한 문장보다는 쉼표로 구분된 태그의 나열이 효과적이며, 높은 품질을 나타내는 태그(예: masterpiece, best quality)로 시작하는 것이 좋습니다 [2]. 특정 단어 뒤에 괄호와 수치를 적용하여 중요도를 조절할 수 있는데, 기본값 1을 기준으로 1.12.0은 해당 요소의 강조를, 00.9는 약화를 의미합니다 [3]. (keyword:factor) 형태의 숫자 입력뿐만 아니라 (keyword)+(keyword)-와 같이 기호를 사용한 중첩 적용도 가능합니다 [1, 4]. 단어의 가중치뿐만 아니라 프롬프트 내에 단어가 배치된 순서 자체도 결과물에 큰 영향을 미칩니다 [5].
  • 네거티브 프롬프트(Negative Prompt)의 전략적 활용: 포지티브 프롬프트가 이미지의 '목표 지점'을 설명한다면, 네거티브 프롬프트는 모델이 빠지기 쉬운 실패 패턴을 차단하는 '회피 지도(avoidance map)' 역할을 수행합니다 [6]. 단순히 "나쁜(bad)"과 같은 모호한 단어를 나열하기보다는 이미지를 분석하여 "여섯 개의 손가락(extra fingers)", "비대칭 눈(asymmetrical eyes)", "워터마크(watermark)" 등 구체적인 결함 요소를 명시해야 모델의 편향을 효과적으로 억제할 수 있습니다 [7, 8]. 네거티브 프롬프트에도 가중치를 부여하여 특정 결함을 더욱 강하게 차단하는 것이 가능합니다 [9, 10].
  • CFG 스케일 및 파라미터 튜닝: CFG 스케일(Classifier-Free Guidance Scale)은 생성되는 이미지가 사용자가 입력한 프롬프트 지시를 얼마나 강력하게 따를지 결정하는 안내 강도입니다 [6, 11]. 일반적으로 7에서 15 사이의 값이 권장됩니다 [12]. 네거티브 프롬프트를 명확하게 작성하지 않은 상태에서 CFG 스케일만 높이면 오히려 잘못된 지시사항이나 편향을 더 강하게 따르게 되므로, 프롬프트와 파라미터 간의 균형이 중요합니다 [13].
  • 컨트롤넷(ControlNet)을 통한 픽셀 단위 통제: 스테이블 디퓨전은 텍스트 프롬프트의 한계를 넘어선 하드웨어 수준의 제어를 제공합니다. 컨트롤넷을 활용하면 이미지의 뼈대(Pose)나 윤곽선(Canny Edge) 정보를 강제로 주입하여 인체의 자세나 사물의 배치를 픽셀 단위로 통제할 수 있습니다 [1].

🔗 Knowledge Connections

  • Related Topics: 프롬프트 가중치 문법(Prompt Weights Syntax), 네거티브 프롬프트(Negative Prompt), CFG 스케일 (CFG Scale), 컨트롤넷(ControlNet)
  • Projects/Contexts: 오픈소스 이미지 생성 파이프라인 및 미세 조정(Fine-tuning) 워크플로우
  • Contradictions/Notes: 가중치를 낮추거나 부정적인 의미를 부여하는 문법 기호에 대해 소스 간 설명의 차이가 있습니다. 특정 가이드에서는 대괄호 []- 기호가 가중치를 0.9배로 약화시키는 역할을 한다고 명시하지만 [1, 3], 다른 시스템(Graydient AI 등)의 파서 규칙에 따르면 대괄호 []는 네거티브 프롬프트로 작동하며, 단순히 숫자를 낮추는 것과 명시적인 네거티브 프롬프트를 사용하는 것은 기술적으로 다른 결과를 낳는다고 조언합니다 [14, 15]. 따라서 사용 중인 UI나 파서 버전에 맞는 정확한 문법 확인이 필요합니다.

Last updated: 2026-04-30