3.7 KiB
3.7 KiB
Negative Prompt
📌 Brief 부문
부정 프롬프트(Negative Prompt)는 AI 이미지 생성 모델에게 결과물에 나타나지 말아야 할 요소들을 지시하는 제어 도구이다 [1]. 이는 단순히 이미지가 생성된 후 필터링을 하는 것이 아니라, 디퓨전(Diffusion) 과정 자체에서 원치 않는 개념(예: 흐릿함, 왜곡된 인체 구조, 워터마크 등)으로부터 멀어지도록 가이던스를 제공한다 [1, 2]. 긍정 프롬프트(Positive prompt)가 이미지가 도달할 '목적지'를 정의한다면, 부정 프롬프트는 피해야 할 '경계'를 설정하여 고품질의 결과물을 안정적으로 얻기 위해 필수적으로 활용된다 [3, 4].
📖 Core Content
- 기능과 원리: 부정 프롬프트는 주로 모델이 가진 편향성이나 반복되는 결함을 방지하는 데 사용된다 [5]. 긍정 프롬프트를 통해 원하는 형태를 묘사하더라도 발생할 수 있는 잉여 사지(extra limbs), 흐릿한 화질(blurry), 워터마크(watermark) 등 시각적 실패 요소를 명시적으로 차단함으로써, 불필요한 이미지 렌더링 횟수(rerolls)를 줄이고 품질을 최적화한다 [1, 2, 6, 7].
- 작성 방법 및 가중치 활용: 효과적인 부정 프롬프트를 작성하려면 포괄적이고 모호한 단어(예: "bad", "ugly")보다는 명확한 명사나 시각적 결함(예: "extra fingers", "misaligned eyes")을 구체적으로 지목해야 한다 [8, 9]. 또한 괄호나 대괄호를 이용한 문법(예:
(blurry:1.5),[dog])을 통해 특정 단어를 회피하려는 강도(가중치)를 조절할 수 있다 [9, 10]. 단, 과도한 가중치나 불필요하게 긴 부정 프롬프트는 이미지의 의도된 스타일이나 인체 구조를 오히려 망칠 수 있으므로, 반복되는 오류를 진단한 후 최소한의 타겟팅된 단어만 사용하는 것이 권장된다 [9, 11-13]. - 플랫폼 및 모델별 특성: 스테이블 디퓨전(Stable Diffusion) 생태계에서는 부정 프롬프트가 필수적인 최적화 도구로 자리 잡고 있다 [2, 14]. 모델 버전에 따라서도 반응이 다른데, SD 1.5는 긴 부정 프롬프트 목록에도 잘 반응하지만, SDXL이나 Flux 같은 최신 모델일수록 길고 방대한 목록보다는 직면한 문제에 맞춘 간결하고 선별적인 부정 프롬프트에 더 잘 반응한다 [15, 16]. 반면 DALL-E 3 모델은 "not", "no", "without"과 같은 부정 지시어를 논리적으로 잘 처리하지 못해, 명시된 단어를 오히려 이미지에 생성해버리는 경향이 있으므로 부정 프롬프트 대신 긍정적인 특성을 직접 묘사하는 방식으로 접근해야 한다 [17-19].
🔗 Knowledge Connections
- Related Topics: Positive Prompt, Stable Diffusion, CFG Scale, Prompt Weighting
- Projects/Contexts: AI 이미지 생성 (AI Image Generation), 프롬프트 엔지니어링 (Prompt Engineering)
- Contradictions/Notes: 스테이블 디퓨전과 같은 모델에서는 부정 프롬프트를 통한 결함 통제가 고품질 이미지 생성에 매우 효과적이고 필수적이지만 [2, 14], DALL-E 3와 같은 텍스트 의존도가 높은 대화형 AI 모델에서는 부정 지시어("not", "without" 등)를 오인하여 원치 않는 요소를 도리어 생성하는 한계가 존재하므로 플랫폼별로 접근 방식을 달리해야 한다 [17-19].
Last updated: 2026-04-30