13 KiB
category, tags, title, last_updated
| category | tags | title | last_updated | ||||
|---|---|---|---|---|---|---|---|
| Unified |
|
|
2026-05-02 |
Negative Prompts
📌 Brief Summary
네거티브 프롬프트(Negative Prompts)는 AI 이미지 생성 모델에게 최종 결과물에 나타나지 말아야 할 요소들을 명시적으로 지시하는 텍스트 명령어입니다[1]. 이는 단순히 이미지를 다듬는 사후 필터가 아니라, 이미지 생성 과정(디퓨전) 중 원치 않는 개념이나 모델의 편향으로부터 방향을 틀도록 안내하는 핵심 제어 시스템 역할을 합니다[1, 2]. 긍정 프롬프트가 도달해야 할 목표를 정의한다면, 네거티브 프롬프트는 피해야 할 경계를 설정하여 고품질의 일관된 이미지를 도출하고 재작업의 낭비를 줄이는 데 필수적인 기법입니다[3-5].
네거티브 프롬프트(Negative Prompts)는 AI 이미지 생성 모델에게 결과물에 포함되지 말아야 할 시각적 요소나 개념을 명시적으로 지시하는 프롬프트 작성 기법입니다. 긍정 프롬프트가 생성할 대상의 목표 지점을 정의한다면, 네거티브 프롬프트는 모델이 피해야 할 경계를 설정하는 회피 지도(Avoidance map) 역할을 합니다 [1, 2]. 이를 통해 해부학적 오류나 불필요한 아티팩트 등을 차단하여 이미지의 품질을 제어하고 최적화할 수 있습니다 [3-5].
부정 프롬프트(Negative Prompts)는 AI 이미지 생성 모델에게 이미지에 포함되지 않아야 할 요소나 개념을 명시적으로 지시하는 제어 시스템이다 [1, 2]. 긍정 프롬프트가 이미지에 포함할 요소를 지시하여 목표(Target)를 설정한다면, 부정 프롬프트는 생성 과정 중 원치 않는 방향이나 편향을 차단하는 회피 지도(Avoidance map) 역할을 수행한다 [3, 4]. 이를 활용하면 불필요한 형태 왜곡이나 시각적 결함을 사전에 방지하여 재작업(Reroll) 횟수를 줄이고 고품질의 결과물을 얻을 수 있다 [5, 6].
📖 Core Content
-
작동 원리 및 중요성:
- 네거티브 프롬프트는 긍정 프롬프트(목표)와 함께 작동하여 피해야 할 지도(Avoidance map)를 모델에 제공합니다[3, 4].
- Stable Diffusion 2.0 이상의 모델에서는 네거티브 프롬프트를 통해 원하는 시각적 결과물에 도달하기 위한 반복 작업(Reroll)을 최대 80%까지 줄일 수 있습니다[5].
- 특히 모델이 학습 데이터로부터 자연스럽게 가지게 된 편향(예: 복잡한 자세에서의 여분의 팔다리, 원치 않는 텍스트, 플라스틱 같은 피부 질감 등)을 억제하고 일관된 품질을 얻는 데 효과적입니다[2, 6].
-
작성 전략 및 구체성:
- 광범위하고 모호한 단어(예: "bad", "ugly")보다는 발생하는 문제에 대한 구체적인 시각적 결함(예: "extra fingers", "misaligned eyes", "watermark")을 명시하는 것이 70% 이상의 실패를 줄이고 정밀도를 두 배로 높이는 핵심입니다[7, 8].
- 문제가 있는 이미지를 먼저 진단한 뒤에, 반복적으로 발생하는 결함을 해결하기 위한 최소한의 명확한 단어만을 사용하는 것이 좋습니다[8-10].
-
가중치 활용과 한계:
- 원치 않는 요소가 계속 나타날 때는
(blurry:1.3)과 같이 괄호와 숫자를 사용해 가중치를 주어 모델이 해당 개념을 회피하도록 강하게 유도할 수 있습니다[11]. - 하지만 길고 방대한 양의 부정적 단어를 붙여넣기보다는, 5~10개의 타겟화되고 가중치가 부여된 용어만을 전략적으로 사용하는 것이 이미지 충실도를 25% 향상시키고 개념의 혼란을 막는 데 유리합니다[7, 12].
- 원치 않는 요소가 계속 나타날 때는
-
플랫폼 및 모델별 접근법:
- Stable Diffusion: 별도의 네거티브 프롬프트 입력란을 활용하여 원치 않는 요소(예: deformed hands, low quality)를 차단하는 것이 표준 워크플로우입니다[13, 14].
- Midjourney:
--no파라미터를 사용하여 프롬프트 끝에 원치 않는 요소를 배제합니다(예: 나무를 빼고 싶다면--no trees입력)[15, 16]. - DALL-E 3: "not", "no", "without"과 같은 부정어 지시를 잘 이해하지 못하고, 오히려 프롬프트에 포함된 해당 요소를 이미지에 생성해 버리는 취약점이 있습니다. 따라서 피하고 싶은 것을 직접 언급하기보다는, 원하는 상태를 긍정적인 언어로 묘사하여 우회해야 합니다[17-19].
-
작동 원리 및 효과: 네거티브 프롬프트는 단순한 사후 필터링이 아니라, 확산(Diffusion) 과정 중에 모델이 원치 않는 방향(예: 저해상도, 기형적인 손가락, 워터마크, 의도하지 않은 CGI 느낌)으로 빠지지 않도록 지속적으로 유도하는 메커니즘입니다 [3, 6]. 'bad'와 같은 모호하고 포괄적인 단어보다는 'extra fingers', 'misaligned eyes', 'text'처럼 눈에 띄는 결함을 구체적이고 물리적인 명사로 진단하여 묘사할 때 두 배 이상의 정밀도를 보입니다 [7-9]. 적절히 사용하면 원하는 시각적 결과물에 도달하기 위한 반복 생성(Reroll) 횟수를 최대 80%까지 줄여줍니다 [4, 10].
-
플랫폼별 메커니즘 및 한계:
- 스테이블 디퓨전(Stable Diffusion): 네거티브 프롬프트가 매우 핵심적인 제어 수단으로 작동합니다 [5, 10]. 가중치 조절 문법(예:
(blurry:1.3))을 적용하여 특정 결함에 대한 거부 강도를 높일 수 있습니다 [11]. 단, 너무 방대한 부정 키워드의 나열은 오히려 개념적 혼란을 초래할 수 있으므로, 5~10개 내외의 타겟팅된 단어에 가중치를 부여해 사용하는 것이 품질 유지에 효과적입니다 [12]. 확산 10단계(Step 10) 이후에 주된 영향력을 발휘하기 때문에 초기부터 너무 강한 가중치를 주면 구조적 왜곡이 일어날 수 있습니다 [12, 13]. - 미드저니(Midjourney): 일반적인 문장에 "without"이나 "no"를 포함시키는 것보다 프롬프트 끝에
--no파라미터(예:--no text, watermark,--no trees)를 명시적으로 선언하는 것이 원치 않는 요소를 제거하는 데 훨씬 효과적입니다 [14-17]. - DALL-E 3: 다른 모델들과 달리 "not", "no", "without"과 같은 부정 지시어(Negations)를 거의 이해하지 못하는 치명적인 약점이 있습니다 [18-20]. 예를 들어 "케이크 없이(no cake)"라고 지시하면 오히려 결과물에 케이크가 등장할 확률이 높습니다 [16, 18]. 따라서 DALL-E에서는 제외할 요소를 언급하기보다 구현되기를 원하는 긍정적인 특성만을 상세히 묘사하여 우회하는 것이 필수적입니다 [19].
- 스테이블 디퓨전(Stable Diffusion): 네거티브 프롬프트가 매우 핵심적인 제어 수단으로 작동합니다 [5, 10]. 가중치 조절 문법(예:
-
작성 전략 및 워크플로우 (Best Practices): 모든 프롬프트에 기계적으로 길고 복잡한 부정 프롬프트를 복사해 붙여넣는 것은 피해야 합니다. 이는 애니메이션 스타일을 원할 때 사진 같은 사실성을 강제하는 등 의도한 스타일까지 훼손할 위험이 있습니다 [21-23]. 올바른 워크플로우는 긍정 프롬프트로 기본 이미지를 먼저 생성한 후, 반복적으로 발생하는 결함(예: 피부가 플라스틱처럼 보임)을 파악하고, 그 증상에 맞는 타겟팅된 부정 키워드(예:
waxy skin,plastic)를 최소한으로 추가하며 점진적으로 정제(Iterative Refinement)해 나가는 것입니다 [8, 23-25].
-
개념 및 작동 원리 원치 않는 요소를 긍정 프롬프트 영역에서 "무엇이 없는(without)" 형태로 묘사하면 모델이 오히려 그 요소를 이미지에 추가하는 역효과가 발생하기 쉽다 [1, 7]. 따라서 별도로 분리된 부정 프롬프트 섹션이나 전용 파라미터를 통해 지시해야 한다. 부정 프롬프트는 생성 과정(Diffusion process)에서 모델을 원치 않는 개념으로부터 밀어내는 안내자 역할을 하며, CFG(Classifier-Free Guidance) 스케일 수치에 따라 모델이 이 회피 지시를 따르는 강도가 결정된다 [2, 4].
-
구체적인 작성법과 가중치 조절 포괄적이거나 모호한 단어(예: "bad", "ugly")를 사용하는 것보다, 시각적으로 명확한 결함을 구체적인 명사나 특징(예: "extra fingers", "misaligned eyes", "watermark")으로 묘사하는 것이 훨씬 효과적이다 [8]. 이상적인 작성 순서는 먼저 기본 프롬프트로 이미지를 생성하고, 반복적으로 발생하는 실패 요소를 진단한 뒤에 해당 문제를 해결할 수 있는 최소한의 타겟팅된 부정 프롬프트를 추가하는 것이다 [9, 10]. 필요한 경우 괄호와 숫자(예:
(blurry:1.3))를 활용한 가중치 부여로 특정 개념에 대한 회피 강도를 세밀하게 조정할 수 있다 [11]. -
주요 플랫폼별 적용 차이점
- 스테이블 디퓨전 (Stable Diffusion): 부정 프롬프트 섹션이 결과물 통제에 가장 강력한 무기로 작동하며, 형태 왜곡, 저화질, 워터마크 등을 명시적으로 차단하는 것이 표준적이다 [12]. 단, SD 1.5, SDXL, Flux 등 모델 버전의 특성에 따라 요구되는 최적화 전략이나 부정 프롬프트의 분량에는 차이가 있다 [13, 14].
- 미드저니 (Midjourney): 텍스트에 부정어를 쓰기보다는 파라미터인
--no를 입력하여 요소를 명시적으로 배제해야 한다(예: 나무가 없는 풍경을 원할 경우--no trees입력) [15]. - DALL-E 3: "not", "no", "don't", "without"과 같은 부정 명령어를 처리하는 데 매우 취약하며, 이러한 단어를 쓰면 오히려 텍스트 내의 요소를 그림에 그려버리는 경향이 있다 [16, 17]. 따라서 부정어를 사용하기보다 원하는 긍정적인 특성을 대체해서 묘사하는 접근이 필요하다 [17].
⚖️ Trade-offs & Caveats
No trade-offs available.
🔗 Knowledge Connections
- Related Topics: Positive Prompts, CFG Scale, Prompt Weights
- Projects/Contexts: Stable Diffusion Image Optimization, DALL-E 3 Negation Handling
- Contradictions/Notes: Stable Diffusion과 Midjourney(파라미터
--no활용)는 원치 않는 요소를 텍스트로 명시하여 완벽하게 배제하는 네거티브 프롬프팅이 잘 작동하지만, DALL-E 3는 "no", "without" 등의 부정어 처리에 취약하여 배제하려는 요소가 오히려 이미지에 포함될 확률이 높으므로 플랫폼 간 프롬프트 전략에 상반된 접근이 필요합니다[9, 16-19].
Last updated: 2026-04-30
- Related Topics: 스테이블 디퓨전 (Stable Diffusion), 프롬프트 가중치 (Prompt Weights), 미드저니 파라미터 (Midjourney Parameters)
- Projects/Contexts: 이미지 결함 수정 및 품질 최적화 워크플로우
- Contradictions/Notes: 스테이블 디퓨전과 미드저니(
--no파라미터)에서는 네거티브 프롬프트가 정밀한 이미지 통제를 위한 필수적인 수단으로 작용하지만, DALL-E 3 모델은 부정적 문맥을 이해하지 못하고 오히려 거부하려던 피사체를 생성해버리는 모순적인 한계(Negation Handling Issue)를 가지고 있어 플랫폼에 따라 적용 전략이 완전히 달라져야 합니다.
Last updated: 2026-04-30
- Related Topics: 프롬프트 엔지니어링 (Prompt Engineering), 가중치 조절 (Prompt Weights), CFG 스케일 (CFG Scale)
- Projects/Contexts: 스테이블 디퓨전 (Stable Diffusion), 미드저니 (Midjourney), DALL-E 3
- Contradictions/Notes: 플랫폼 간 부정 지시어 처리 능력에 극명한 차이가 존재한다. 스테이블 디퓨전과 미드저니는 전용 부정 프롬프트 섹션이나
--no파라미터를 통해 원치 않는 요소를 효과적으로 차단하는 반면 [12, 15], DALL-E 3와 같은 일부 모델은 부정적인 언어 표현("no", "without" 등)을 문맥적으로 올바르게 이해하지 못하고 배제하려던 객체를 오히려 결과물에 포함시키는 역효과를 발생시킨다 [7, 17].
Last updated: 2026-04-30