Files
2nd/10_Wiki/Topics/Stable Diffusion 오픈소스 제어.md
T

4.1 KiB

Stable Diffusion 오픈소스 제어

📌 Brief Summary

Stable Diffusion은 Stability AI에서 개발한 오픈소스 텍스트-이미지 생성 AI 모델로, 사용자에게 모델 훈련과 하드웨어 수준의 정밀한 제어 권한을 제공합니다 [1-3]. 클라우드 기반의 다른 모델들과 달리 충분한 컴퓨팅 자원을 갖춘 로컬 머신에서 구동 가능하여 프라이버시를 보장하고 다양한 커뮤니티 커스텀 모델을 활용할 수 있습니다 [4, 5]. 프롬프트 가중치 조절, 부정 프롬프트, 컨트롤넷(ControlNet) 등의 특화 기능을 통해 생성 결과물을 픽셀 단위까지 세밀하게 제어할 수 있는 것이 핵심 특징입니다 [3].

📖 Core Content

  • 오픈소스 기반의 유연성과 로컬 구동: Stable Diffusion은 완전한 제어권과 도메인 특화 커스터마이징을 제공하는 오픈소스 확산(Diffusion) 모델입니다 [2, 5]. 충분한 GPU를 갖춘 시스템에서 오프라인으로 작동할 수 있으며, 커뮤니티에서 개발한 수천 개의 모델을 자유롭게 활용할 수 있습니다 [4, 6]. 다만 초보자에게는 초기 설정과 로컬 구동 구성이 다소 복잡할 수 있다는 진입 장벽이 존재합니다 [7].
  • 프롬프트 가중치(Prompt Weights)를 통한 미세 조정: (keyword:factor)와 같은 문법을 통해 텍스트 프롬프트 내 특정 단어의 중요도를 숫자로 지정할 수 있습니다 [3]. 예를 들어 + 기호나 (단어:1.1) 구문을 사용해 특정 개념을 강조하고, - 기호나 (단어:0.9)로 비중을 낮춰 요소들 간의 시각적 균형을 미세하게 제어합니다 [8, 9].
  • 부정 프롬프트(Negative Prompt)의 전략적 사용: 워터마크, 변형된 손가락, 저화질 등 원치 않는 요소를 명시적으로 차단하기 위해 부정 프롬프트를 활용합니다 [3, 10]. 이는 단순히 이미지를 다듬는 것을 넘어 생성 과정 전반에서 모델의 방향성을 제어하는 필수 도구로, 원하는 결과물을 얻기 위한 반복 생성(Reroll) 횟수를 최대 80%까지 줄여줍니다 [10, 11].
  • CFG Scale 및 매개변수 제어: 생성 과정의 무작위성을 통제하기 위해 샘플링 스텝(sampling steps)과 CFG 스케일(Classifier-Free Guidance Scale)을 조정할 수 있습니다 [12]. 특히 CFG 스케일은 모델이 긍정적 프롬프트와 부정적 프롬프트를 얼마나 강력하게 따를지 결정하는 지시 강도(intensity of guidance) 역할을 수행합니다 [13].
  • 컨트롤넷(ControlNet)을 이용한 픽셀 단위 통제: 단순 텍스트 지시어를 넘어, 이미지의 뼈대(Pose)나 윤곽선(Canny Edge) 정보를 강제로 주입하는 수준 높은 고급 제어 기술입니다 [3]. 이를 통해 인체의 자세나 사물의 배치를 픽셀 단위로 완벽하게 통제하여 프롬프트가 가진 언어적 한계를 시각적으로 극복할 수 있습니다 [3].

🔗 Knowledge Connections


Last updated: 2026-04-30