Files
2nd/10_Wiki/Topics/AI_and_ML/스테이블 디퓨전의 가중치 및 제어 시스템.md
T

5.4 KiB

id, title, category, status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, tags, raw_sources, last_reinforced, github_commit, inferred_by
id title category status canonical_id aliases duplicate_of source_trust_level confidence_score tags raw_sources last_reinforced github_commit inferred_by
wiki-2026-0508-스테이블-디퓨전의-가중치-및-제어-시스템 스테이블 디퓨전의 가중치 및 제어 시스템 10_Wiki/Topics needs_review self
none A 0.92
uncategorized
2026-05-08 pending Claude Opus 4.7 (auto-normalize 2026-05-08)

스테이블 디퓨전의 가중치 및 제어 시스템

📌 한 줄 통찰 (The Karpathy Summary)

스테이블 디퓨전(Stable Diffusion)의 가중치 및 제어 시스템은 텍스트 프롬프트 내 특정 요소의 영향력을 조절하고 원치 않는 요소를 배제하여 이미지 생성을 통제하는 핵심 메커니즘입니다. 사용자는 괄호와 숫자, 기호를 활용한 가중치 문법을 통해 픽셀 단위의 섬세한 조정이 가능합니다. 이 시스템은 텍스트의 한계를 극복하고 모델이 사용자의 구체적 의도를 정확히 시각화하도록 돕는 필수적인 역할을 합니다.

📖 구조화된 지식 (Synthesized Content)

  • 프롬프트 가중치 조절 (Prompt Weighting):

    • 스테이블 디퓨전에서 가중치 조절은 단어나 구문의 중요도를 세밀하게 지정하는 가장 강력한 무기 중 하나입니다 [1]. 기본 가중치는 1이며, 더 큰 강조를 원할 때는 + 기호나 1.12 사이의 숫자를, 약화시키고자 할 때는 - 기호나 00.9 사이의 숫자를 덧붙여 사용합니다 [2].
    • 문법적으로는 (keyword:factor) 형태를 사용하거나 괄호의 중첩(예: (word)+++, (word)1.1)을 통해 효과를 증폭시킵니다 [1, 3].
    • 가중치 설정 시 0.5에서 0.7 사이가 다른 시각적 개념과 충돌을 피할 수 있는 가장 안전한 기본 범위로 간주되며, 지나치게 높은 가중치(예: 2.0)는 단일 프롬프트를 너무 강하게 만들어 렌더링을 깨뜨릴 수 있습니다 [4, 5].
  • 부정 프롬프트(Negative Prompts) 기반의 회피 제어:

    • 긍정 프롬프트가 목표(target)라면 부정 프롬프트는 회피 지도(avoidance map)의 역할을 수행합니다 [6]. 워터마크, 왜곡된 인체 등 생성 과정에서 빈번하게 발생하는 결함을 명시적으로 차단하여 고품질 결과물을 유지하게 합니다 [1, 7].
    • 단순한 "나쁜(bad)" 같은 포괄적인 단어보다 "여섯 개의 손가락(six fingers)", "비대칭 눈(asymmetrical eyes)"과 같은 구체적인 시각적 특성을 명시하는 것이 효과적입니다 [8].
    • 부정 프롬프트 내의 단어에도 가중치(예: (blurry:1.5), (deformed:1.2))를 적용하여 특정 결함을 피하는 데 모델의 주의를 더 강하게 집중시킬 수 있습니다 [9].
  • 고급 시각적 제어 시스템 (ControlNet 및 CFG):

    • 컨트롤넷(ControlNet): 텍스트를 넘어 이미지의 뼈대(Pose)나 윤곽선(Canny Edge) 정보를 강제로 주입함으로써, 인체의 자세나 사물의 배치를 픽셀 단위로 완벽하게 통제하는 고급 제어 기술입니다 [1].
    • CFG 스케일 및 샘플링 스텝: 사용자는 CFG 스케일(Classifier-Free Guidance Scale)과 샘플링 스텝을 조절하여 이미지 생성의 가변성을 통제할 수 있습니다 [10]. CFG 스케일은 모델이 사용자의 긍정 및 부정 프롬프트 지시를 얼마나 강하게 따를지(안내의 강도)를 결정합니다 [6, 11].

🔗 지식 연결 (Graph)


Last updated: 2026-04-30

🤖 LLM 활용 힌트 (How to Use This Knowledge)

언제 이 지식을 쓰는가:

  • (TODO)

언제 쓰면 안 되는가:

  • (TODO)

🧪 검증 상태 (Validation)

  • 정보 상태: needs_review
  • 출처 신뢰도: A
  • 검토 이유: (P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)

🧬 중복 검사 (Duplicate Check)

  • 기존 유사 문서: (TODO: 인덱서 클러스터 리포트 참조)
  • 처리 방식: UPDATE (자동 정규화)
  • 처리 이유: Phase 1 정규화 — 옛 템플릿/누락 필드 보강.

⚠️ 모순 및 업데이트 (Contradictions & Updates)

  • 과거 데이터와의 충돌: 없음
  • 정책 변화: 없음

🕓 변경 이력 (Changelog)

날짜 변경 내용 처리 방식 신뢰도
2026-05-08 P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) UPDATE A