Files
2nd/10_Wiki/Topics_GD/스테이블 디퓨전의 가중치 및 제어 시스템.md
T

3.7 KiB

스테이블 디퓨전의 가중치 및 제어 시스템

📌 Brief Summary

스테이블 디퓨전(Stable Diffusion)의 가중치 및 제어 시스템은 텍스트 프롬프트 내 특정 요소의 영향력을 조절하고 원치 않는 요소를 배제하여 이미지 생성을 통제하는 핵심 메커니즘입니다. 사용자는 괄호와 숫자, 기호를 활용한 가중치 문법을 통해 픽셀 단위의 섬세한 조정이 가능합니다. 이 시스템은 텍스트의 한계를 극복하고 모델이 사용자의 구체적 의도를 정확히 시각화하도록 돕는 필수적인 역할을 합니다.

📖 Core Content

  • 프롬프트 가중치 조절 (Prompt Weighting):

    • 스테이블 디퓨전에서 가중치 조절은 단어나 구문의 중요도를 세밀하게 지정하는 가장 강력한 무기 중 하나입니다 [1]. 기본 가중치는 1이며, 더 큰 강조를 원할 때는 + 기호나 1.12 사이의 숫자를, 약화시키고자 할 때는 - 기호나 00.9 사이의 숫자를 덧붙여 사용합니다 [2].
    • 문법적으로는 (keyword:factor) 형태를 사용하거나 괄호의 중첩(예: (word)+++, (word)1.1)을 통해 효과를 증폭시킵니다 [1, 3].
    • 가중치 설정 시 0.5에서 0.7 사이가 다른 시각적 개념과 충돌을 피할 수 있는 가장 안전한 기본 범위로 간주되며, 지나치게 높은 가중치(예: 2.0)는 단일 프롬프트를 너무 강하게 만들어 렌더링을 깨뜨릴 수 있습니다 [4, 5].
  • 부정 프롬프트(Negative Prompts) 기반의 회피 제어:

    • 긍정 프롬프트가 목표(target)라면 부정 프롬프트는 회피 지도(avoidance map)의 역할을 수행합니다 [6]. 워터마크, 왜곡된 인체 등 생성 과정에서 빈번하게 발생하는 결함을 명시적으로 차단하여 고품질 결과물을 유지하게 합니다 [1, 7].
    • 단순한 "나쁜(bad)" 같은 포괄적인 단어보다 "여섯 개의 손가락(six fingers)", "비대칭 눈(asymmetrical eyes)"과 같은 구체적인 시각적 특성을 명시하는 것이 효과적입니다 [8].
    • 부정 프롬프트 내의 단어에도 가중치(예: (blurry:1.5), (deformed:1.2))를 적용하여 특정 결함을 피하는 데 모델의 주의를 더 강하게 집중시킬 수 있습니다 [9].
  • 고급 시각적 제어 시스템 (ControlNet 및 CFG):

    • 컨트롤넷(ControlNet): 텍스트를 넘어 이미지의 뼈대(Pose)나 윤곽선(Canny Edge) 정보를 강제로 주입함으로써, 인체의 자세나 사물의 배치를 픽셀 단위로 완벽하게 통제하는 고급 제어 기술입니다 [1].
    • CFG 스케일 및 샘플링 스텝: 사용자는 CFG 스케일(Classifier-Free Guidance Scale)과 샘플링 스텝을 조절하여 이미지 생성의 가변성을 통제할 수 있습니다 [10]. CFG 스케일은 모델이 사용자의 긍정 및 부정 프롬프트 지시를 얼마나 강하게 따를지(안내의 강도)를 결정합니다 [6, 11].

🔗 Knowledge Connections


Last updated: 2026-04-30