3.7 KiB
3.7 KiB
프롬프트 구조 및 문법 (Prompt Structure & Syntax)
📌 Brief Summary
프롬프트 구조 및 문법은 인공지능 이미지 생성 모델이 사용자의 추상적인 의도를 시각적 기호로 정확하게 변환할 수 있도록 지시어를 논리적으로 배치하는 계층적 뼈대입니다 [1]. 효과적인 프롬프트는 단순한 단어의 나열이 아니라 주체, 환경, 스타일, 조명, 구도 및 기술적 매개변수 등의 요소를 체계적으로 구성한 15~50단어 분량의 문장이나 구문으로 이루어집니다 [1, 2]. 이러한 체계화는 모델의 혼란을 줄이고 고품질의 결과물을 일관되게 도출하는 핵심 역할을 합니다 [3, 4].
📖 Core Content
-
기본 프롬프트 공식 및 계층 구조 성공적인 프롬프트는 일반적으로 다음의 4~5단계 레이어 패턴으로 구성됩니다 [1, 2].
- 주체 (Subject): 이미지의 중심 초점으로, 구체적인 특징이나 행동을 포함하여 정의합니다 (예: "맞춤형 검은 코트를 입은 여성") [4, 8-10].
- 환경 및 맥락 (Environment/Context): 주체가 존재하는 공간과 시간적 배경을 설정하여 서사를 부여합니다 [2, 11].
- 매체 및 스타일 (Medium & Style): 예술적 형식(유화, 3D 렌더링 등)이나 특정 장르를 결정합니다 [9-11].
- 조명 및 카메라 구도 (Lighting & Composition): 빛의 방향(골든 아워 등)과 카메라 렌즈(85mm), 앵글 등을 명시하여 시각적 연출을 완성합니다 [12-14].
- 기술 매개변수 (Parameters): 모델 고유의 명령어(종횡비
--ar, 스타일화--s등)를 프롬프트 마지막에 배치하여 최종 출력을 제어합니다 [14-17].
-
어순과 문법의 중요성 AI 모델은 프롬프트의 앞부분에 위치한 단어일수록 더 큰 가중치를 부여하는 경향이 있습니다 [18, 19]. 따라서 첫 번째 섹션에 주체와 환경을 배치하고, 두 번째 섹션에 색상/스타일/조명을, 마지막에 구도와 매개변수를 그룹화하여 구조화하는 것이 권장됩니다 [20, 21].
-
플랫폼별 특화 문법
- 미드저니 (Midjourney):
/imagine명령어로 시작하며, 텍스트 프롬프트 뒤에--로 시작하는 매개변수를 배치합니다 [23, 24].::문법으로 다중 프롬프트 가중치를 조절할 수 있습니다. - DALL-E 3: 쉼표 구분 키워드보다 완전한 자연어 문장 형태에 훨씬 더 잘 반응하며, 부정형 지시어보다는 긍정형 서술이 효과적입니다 [25, 26].
- 스테이블 디퓨전 (Stable Diffusion): 쉼표로 구분된 태그(키워드) 구조를 사용하며,
(keyword:factor)가중치 문법과 별도의 부정 프롬프트(Negative Prompt) 구조를 통해 정밀하게 통제합니다 [27-29].
- 미드저니 (Midjourney):
⚖️ Trade-offs & Caveats
- 플랫폼별 상이함: DALL-E 3는 자연어에 최적화되어 있으나, 스테이블 디퓨전은 태그 중심 문법이 더 우수하며 과도한 괄호 사용은 오히려 가중치 처리를 방해할 수 있습니다.
- 부정 프롬프트의 한계: DALL-E 3와 같은 일부 모델은 부정형 지시어를 명확히 이해하지 못하므로 긍정형 묘사를 통한 우회 전략이 필요합니다.
🔗 Knowledge Connections
- Related Topics: 프롬프트 가중치 (Prompt Weights), 부정 프롬프트 (Negative Prompts), 매개변수 (Parameters)
- Projects/Contexts: 미드저니 (Midjourney) 워크플로우, 스테이블 디퓨전 (Stable Diffusion) 최적화
Last updated: 2026-04-30