Files
2nd/10_Wiki/Topics/프롬프트 구조 및 문법.md
T

4.8 KiB

프롬프트 구조 및 문법

📌 Brief 시각

프롬프트 구조 및 문법은 인공지능 이미지 생성 모델이 사용자의 의도를 명확히 이해하고 시각적 기호로 변환할 수 있도록 지시어를 논리적으로 배열하는 체계입니다 [1]. 일반적으로 주체, 배경(환경), 스타일, 조명, 그리고 기술적 매개변수를 아우르는 계층적 구조를 따르며, 약 15~50단어 분량으로 구성할 때 가장 효과적입니다 [2]. 모델별로 선호하는 구문(Syntax)과 가중치 부여 방식이 다르기 때문에, 각 플랫폼의 언어 규칙을 이해하는 것이 고품질 이미지를 생성하는 핵심입니다 [3, 4].

📖 Core Content

  • 프롬프트의 기본 계층 구조 성공적인 프롬프트는 일반적으로 다음의 4~5단계 레이어 패턴으로 구성됩니다 [1, 2]. 관련된 토큰들을 그룹화하여 배치할 경우 모델이 이를 반영할 확률이 높아집니다 [5].

    • 주체 (Subject): 이미지의 중심 초점 및 서사적 주인공으로, 막연한 명사보다는 구체적인 특징이나 행동이 포함된 묘사가 좋습니다 (예: 은색 털의 메인쿤 고양이) [6-8].
    • 환경 및 맥락 (Environment/Context): 주체가 존재하는 배경과 시간적, 공간적 맥락을 설정하여 서사적 분위기를 만듭니다 [4, 6, 9].
    • 매체 및 스타일 (Medium & Style): 예술적 형식(유화, 수채화, 3D 렌더링 등)이나 특정 작가의 화풍을 정의하여 이미지의 전반적인 질감을 결정합니다 [4, 6, 8, 10].
    • 조명 및 카메라 구도 (Lighting & Composition): 림 라이팅, 골든 아워와 같은 명암 대비와 85mm 렌즈, 하이 앵글 등 기술적 시각 연출을 명시합니다 [4, 6, 10-12].
    • 기술 매개변수 (Parameters): 모델 고유의 명령어를 통해 종횡비, 예술적 해석 강도(Stylize) 등 출력물을 시스템적으로 제어합니다 [4, 13].
  • 플랫폼별 특화 문법 및 구문 (Syntax)

    • 미드저니 (Midjourney): [주체] [행동/배경] [스타일/아티스트] [세부사항/수식어] [--매개변수]의 공식을 따르며, 명령어 뒤에 --ar 16:9, --v 7 등과 같이 하이픈 두 개로 시작하는 매개변수를 프롬프트 맨 끝에 덧붙여 제어합니다 [13-16]. :: 문법을 사용해 다중 프롬프트의 가중치를 설정할 수도 있습니다 [17].
    • DALL-E 3: 자연어 의존도가 높아 키워드의 나열보다는 문장 형태의 서술이 유리합니다 [18, 19]. 내장된 언어 모델(GPT)이 사용자의 짧은 지시를 상세한 묘사로 자동 확장(Expansion)하여 이미지를 생성하지만, 부정형 지시어(예: "No", "Without")를 잘 이해하지 못하는 약점이 있으므로 긍정형 문장으로 구성해야 합니다 [19-21].
    • 스테이블 디퓨전 (Stable Diffusion): 완전한 문장보다는 쉼표로 구분된 태그(키워드) 배열을 사용하는 것이 효과적입니다 [22, 23]. 텍스트 인코더가 단어를 수치적 토큰으로 분할하여 이해하기 때문입니다 [24]. 괄호를 이용한 (keyword:factor) 가중치 문법이 핵심이며, (단어:1.1), (단어)+++, 혹은 부정의 경우 [단어]의 구문으로 단어의 중요도를 픽셀 단위로 통제합니다 [25-28].
  • 부정 프롬프트 (Negative Prompt) 작성법 부정 프롬프트는 이미지에 나타나지 않기를 바라는 요소를 차단하는 문법입니다 [29, 30].

    • "나쁜(bad)"과 같은 모호한 단어의 나열보다는 "융합된 손가락(fused fingers)", "워터마크(watermark)" 등 구체적 결함을 지칭하는 명사를 입력해야 합니다 [31, 32].
    • 단순한 목록 작성을 넘어 가중치 문법 (blurry:1.3)을 함께 사용해 억제 강도를 미세하게 조절할 수 있습니다 [33].
    • 미드저니의 경우 --no 매개변수 뒤에 제외할 단어를 작성하는 방식을 취합니다 [17, 34].

🔗 Knowledge Connections

  • Related Topics: 프롬프트 가중치(Prompt Weight), 부정 프롬프트(Negative Prompt), 기술적 매개변수(Parameters)
  • Projects/Contexts: 미드저니(Midjourney) 파라미터 제어, 스테이블 디퓨전(Stable Diffusion) 구문 작성, DALL-E 3 자연어 프롬프팅
  • Contradictions/Notes: DALL-E 3 모델은 완전한 자연어 문장을 기반으로 프롬프트를 이해하고 작성하는 것이 좋으나 [18, 19], 스테이블 디퓨전은 완전한 문장이 아닌 쉼표로 분리된 형태의 태그 중심 문법을 사용하는 것이 더 우수한 결과물을 만들어냅니다 [22, 23].

Last updated: 2026-04-30