# [[Stable Diffusion]] ## πŸ“Œ Brief μ‹œ Summary μŠ€ν…Œμ΄λΈ” 디퓨전(Stable Diffusion)은 Stability AIκ°€ κ°œλ°œν•œ λŒ€ν‘œμ μΈ μ˜€ν”ˆμ†ŒμŠ€ ν™•μ‚°(Diffusion) 기반 ν…μŠ€νŠΈ-이미지 생성 인곡지λŠ₯ λͺ¨λΈμž…λ‹ˆλ‹€[1]. μ‚¬μš©μžκ°€ 직접 λͺ¨λΈμ„ ν˜ΈμŠ€νŒ…ν•˜κ³  νŠΉμ • 도메인에 맞게 λ―Έμ„Έ μ‘°μ •(Fine-tuning)을 ν•  수 μžˆμ–΄ μ™„λ²½ν•œ μ œμ–΄ κΆŒν•œμ„ μ œκ³΅ν•˜λŠ” 것이 νŠΉμ§•μž…λ‹ˆλ‹€[2, 3]. ν”„λ‘¬ν”„νŠΈ μž‘μ„± μ‹œ μžμ—°μ–΄ λ¬Έμž₯λ³΄λ‹€λŠ” μ‰Όν‘œλ‘œ κ΅¬λΆ„λœ νƒœκ·Έ(Tags)와 κ°€μ€‘μΉ˜ 문법을 μ‚¬μš©ν•˜λ©°, λΆ€μ • ν”„λ‘¬ν”„νŠΈ(Negative Prompt)λ₯Ό 톡해 생성 κ²°κ³Όλ₯Ό ν”½μ…€ λ‹¨μœ„κΉŒμ§€ 맀우 μ •κ΅ν•˜κ²Œ ν†΅μ œν•  수 μžˆμŠ΅λ‹ˆλ‹€[4-6]. ## πŸ“– Core Content * **μž‘λ™ λ©”μ»€λ‹ˆμ¦˜ (Diffusion Process)** μŠ€ν…Œμ΄λΈ” 디퓨전은 데이터에 μ μ§„μ μœΌλ‘œ κ°€μš°μ‹œμ•ˆ λ…Έμ΄μ¦ˆλ₯Ό μΆ”κ°€ν•˜λŠ” 순방ν–₯ ν™•μ‚°(Forward Diffusion) 과정을 ν•™μŠ΅ν•œ λ’€, λ¬΄μž‘μœ„ λ…Έμ΄μ¦ˆ μƒνƒœμ—μ„œ 이λ₯Ό 반볡적으둜 제거(Denoising)ν•˜λ©° 원본 데이터와 μΌμΉ˜ν•˜λŠ” μΌκ΄€λœ μ‹œκ°μ  결과물을 μž¬κ΅¬μ„±ν•˜λŠ” μ—­λ°©ν–₯ ν™•μ‚°(Reverse Diffusion) 방식을 μ‚¬μš©ν•©λ‹ˆλ‹€[7, 8]. μ‚¬μš©μžκ°€ μž…λ ₯ν•œ ν”„λ‘¬ν”„νŠΈ ν…μŠ€νŠΈλŠ” ν† ν¬λ‚˜μ΄μ €(Tokenizer)λ₯Ό 톡해 인곡지λŠ₯이 이해할 수 μžˆλŠ” 수치적 토큰(Tokens)으둜 λΆ„ν• λ˜μ–΄ 이미지 생성 과정을 μœ λ„ν•©λ‹ˆλ‹€[9]. * **ν”„λ‘¬ν”„νŠΈ ꡬ쑰 및 문법 (Syntax)** μ™„μ „ν•œ ν˜•νƒœμ˜ λ¬Έμž₯을 μ„ ν˜Έν•˜λŠ” λ‹€λ₯Έ λͺ¨λΈλ“€κ³Ό 달리, μŠ€ν…Œμ΄λΈ” 디퓨전은 μ‰Όν‘œλ‘œ κ΅¬λΆ„λœ νƒœκ·Έ(Tags) ν˜•μ‹μ„ μ‚¬μš©ν•˜λŠ” 것이 κ°€μž₯ νš¨κ³Όμ μž…λ‹ˆλ‹€[4]. κ°€μž₯ μ€‘μš”ν•œ μ‹œκ°μ  μš”μ†ŒμΌμˆ˜λ‘ ν”„λ‘¬ν”„νŠΈμ˜ 맨 μ•žμ— λ°°μΉ˜ν•΄μ•Ό ν•˜λ©°, κ΄„ν˜Έλ₯Ό μ‚¬μš©ν•΄ νŠΉμ • λ‹¨μ–΄μ˜ κ°€μ€‘μΉ˜(Weights)λ₯Ό μ‘°μ ˆν•  수 μžˆμŠ΅λ‹ˆλ‹€[4, 6]. * 예λ₯Ό λ“€μ–΄ `(word:1.5)`와 같이 μž…λ ₯ν•˜λ©΄ ν•΄λ‹Ή λ‹¨μ–΄μ˜ μ€‘μš”λ„λ₯Ό 1.5배둜 κ°•ν™”ν•˜κ³ , λ°˜λŒ€λ‘œ `[word]` λ˜λŠ” `(word:0.9)`둜 μž…λ ₯ν•˜λ©΄ κ·Έ 비쀑을 μ•½ν™”μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€[6, 10, 11]. * `+`λ‚˜ `-` 기호λ₯Ό μ΄μš©ν•΄ `(word)+++` ν˜•νƒœλ‘œ κ°€μ€‘μΉ˜λ₯Ό λˆ„μ  μ μš©ν•  μˆ˜λ„ μžˆμŠ΅λ‹ˆλ‹€[12, 13]. * **λΆ€μ • ν”„λ‘¬ν”„νŠΈ (Negative Prompt)** λΆ€μ • ν”„λ‘¬ν”„νŠΈλŠ” 이미지에 λ‚˜νƒ€λ‚˜μ§€ 말아야 ν•  μš”μ†Œ(예: deformed hands, extra fingers, watermark, blurry λ“±)λ₯Ό λͺ…μ‹œν•˜μ—¬ ν™•μ‚° 과정이 잘λͺ»λœ λ°©ν–₯으둜 흐λ₯΄λŠ” 것을 μ°¨λ‹¨ν•˜λŠ” 핡심 ν†΅μ œ μ‹œμŠ€ν…œμž…λ‹ˆλ‹€[5, 6, 14]. * μ΄λŠ” λ‹¨μˆœνžˆ 이미지λ₯Ό λ‹€λ“¬λŠ” 것을 λ„˜μ–΄ λΆˆν•„μš”ν•œ 반볡 생성(Reroll)을 쀄이고 μ›ν•˜λŠ” 결과물에 λ„λ‹¬ν•˜λŠ” 데 ν•„μˆ˜μ μž…λ‹ˆλ‹€[15, 16]. * λͺ¨ν˜Έν•˜κ²Œ "bad"라고 μ λŠ” 것보닀 "extra fingers", "watermark"처럼 ꡬ체적인 결함을 지적할 λ•Œ 정확도가 훨씬 λ†’μ•„μ§‘λ‹ˆλ‹€[17, 18]. * CFG 척도(CFG Scale)와 κ²°ν•©ν•˜μ—¬ λͺ¨λΈμ΄ ν”„λ‘¬ν”„νŠΈμ™€ λΆ€μ • ν”„λ‘¬ν”„νŠΈμ˜ 쑰건(Conditioning)을 μ–Όλ§ˆλ‚˜ κ°•ν•˜κ²Œ λ”°λ₯Όμ§€ μ‘°μ ˆν•  수 μžˆμŠ΅λ‹ˆλ‹€[19, 20]. * **버전별 νŠΉμ„±κ³Ό κ³ κΈ‰ μ œμ–΄** SD 1.5, SDXL, Flux λ“± μŠ€ν…Œμ΄λΈ” λ””ν“¨μ „μ˜ μ„ΈλΆ€ λͺ¨λΈλ§ˆλ‹€ λΆ€μ • ν”„λ‘¬ν”„νŠΈλ₯Ό μˆ˜μš©ν•˜λŠ” μ„±ν–₯이 λ‹€λ¦…λ‹ˆλ‹€[21]. SD 1.5λŠ” κΈ΄ ν˜•νƒœμ˜ λΆ€μ • ν”„λ‘¬ν”„νŠΈλ₯Ό 잘 μˆ˜μš©ν•˜μ§€λ§Œ, SDXLμ΄λ‚˜ μ΅œμ‹  λͺ¨λΈμ€ λ„ˆλ¬΄ κΈΈκ³  포괄적인 λΆ€μ • ν”„λ‘¬ν”„νŠΈλ₯Ό μž…λ ₯ν•˜λ©΄ 였히렀 μ΄λ―Έμ§€μ˜ λ””ν…ŒμΌμ΄λ‚˜ ꡬ도λ₯Ό 망칠 수 μžˆμœΌλ―€λ‘œ 문제점만 μ§šμ–΄λ‚Έ κ°„κ²°ν•œ λͺ©λ‘μ„ μ‚¬μš©ν•˜λŠ” 것이 ꢌμž₯λ©λ‹ˆλ‹€[21, 22]. λ˜ν•œ κ³ κΈ‰ 기술인 μ»¨νŠΈλ‘€λ„·(ControlNet)을 κ²°ν•©ν•˜λ©΄ ν…μŠ€νŠΈ ν”„λ‘¬ν”„νŠΈλΏλ§Œ μ•„λ‹ˆλΌ ν”Όμ‚¬μ²΄μ˜ λΌˆλŒ€(Pose)λ‚˜ μœ€κ³½μ„ (Canny Edge) 정보λ₯Ό λͺ¨λΈμ— κ°•μ œλ‘œ μ£Όμž…ν•˜μ—¬ ν”Όμ‚¬μ²΄μ˜ λ°°μΉ˜μ™€ μžμ„Έλ₯Ό ν”½μ…€ λ‹¨μœ„λ‘œ μ™„λ²½ν•˜κ²Œ ν†΅μ œν•  수 μžˆμŠ΅λ‹ˆλ‹€[6]. ## πŸ”— Knowledge Connections - **Related Topics:** [[Diffusion Models]], [[Prompt Weights]], [[Negative Prompt]], [[CFG Scale]], [[ControlNet]] - **Projects/Contexts:** [[μ˜€ν”ˆμ†ŒμŠ€ 기반 λ§žμΆ€ν˜• 이미지 생성 μ›Œν¬ν”Œλ‘œμš° ꡬ좕]], [[λΆ€μ • ν”„λ‘¬ν”„νŠΈμ™€ κ°€μ€‘μΉ˜λ₯Ό ν™œμš©ν•œ μ‹œκ°μ  μ•„ν‹°νŒ©νŠΈ(Artifact) 디버깅 및 μ œμ–΄]] - **Contradictions/Notes:** μžμ—°μ–΄ 기반의 μƒμ„Έν•œ λ¬Έμž₯ λ¬˜μ‚¬λ₯Ό μ„ ν˜Έν•˜λŠ” DALL-E 3와 달리, μŠ€ν…Œμ΄λΈ” 디퓨전은 μ‰Όν‘œλ‘œ λΆ„λ¦¬λœ νƒœκ·Έμ™€ κ°€μ€‘μΉ˜ 문법을 μ‚¬μš©ν•˜λŠ” 것이 더 높은 ν’ˆμ§ˆμ„ 보μž₯ν•©λ‹ˆλ‹€[4, 23]. λ˜ν•œ, 무쑰건 κΈΈκ³  일반적인 λΆ€μ • ν”„λ‘¬ν”„νŠΈ 볡사-λΆ™μ—¬λ„£κΈ°λ₯Ό λ°˜λ³΅ν•˜λŠ” 것은 μ΅œμ‹  λͺ¨λΈ(SDXL, Flux λ“±)μ—μ„œ 였히렀 λΆ€μž‘μš©μ„ 낳을 수 μžˆμœΌλ―€λ‘œ μ‹œκ°μ μœΌλ‘œ λ‚˜νƒ€λ‚œ ꡬ체적인 κ²°ν•¨λ§Œ νƒ€κ²ŸνŒ…ν•˜μ—¬ λ°°μ œν•˜λŠ” 것이 νš¨κ³Όμ μž…λ‹ˆλ‹€[18, 22, 24]. --- *Last updated: 2026-04-30*