5.9 KiB
5.9 KiB
image prompt 작성 방법
📌 Brief 시 Summary
이미지 프롬프트(Image Prompt)는 Midjourney, DALL-E, Stable Diffusion과 같은 AI 이미지 생성 모델에게 어떤 이미지를 생성할지 지시하는 텍스트 설명입니다 [1, 2]. 효과적인 프롬프트는 단순히 피사체를 명시하는 것을 넘어 조명, 스타일, 구도, 카메라 앵글 등을 구체적으로 정의하여 인간의 상상력을 기계가 이해할 수 있는 시각적 기호로 번역하는 청사진 역할을 합니다 [1-3]. 각 AI 모델의 특성(아키텍처, 매개변수, 자연어 처리 능력)에 맞춘 프롬프트 구조화와 반복적인 수정 작업이 고품질 AI 아트를 생성하는 핵심입니다 [4-6].
📖 Core Content
프롬프트의 기본 구조 (Basic Prompt Structure) 성공적인 이미지 프롬프트는 모델이 혼동하지 않도록 보통 15~50단어 내외의 논리적이고 명확한 계층 구조를 따릅니다 [6-8].
- 주체(Subject): 이미지의 중심이 되는 인물, 사물, 또는 장면입니다. 단순한 명사("고양이")보다는 구체적인 묘사("창가에서 오후의 햇살을 받으며 졸고 있는 은색 털의 고양이")를 사용해야 모델이 더 선명한 특징을 추출합니다 [9-11].
- 환경 및 맥락(Context/Environment): 주체가 존재하는 장소나 분위기를 설정하여 서사적 깊이와 톤을 결정합니다(예: 안개 낀 숲, 골든 아워의 도쿄 거리) [9, 12, 13].
- 매체 및 스타일(Medium & Style): '유화', '수채화', '35mm 필름 사진', '디지털 아트' 등의 시각적 형식이나 '사이버펑크', 특정 예술가의 화풍을 명시하여 이미지의 미학적 방향과 질감을 통제합니다 [9, 11, 14].
- 조명 및 카메라 구도(Lighting & Camera): '골든 아워', '스튜디오 조명', '볼륨메트릭 라이팅(Volumetric Lighting)' 등의 조명 지시어와 '85mm 렌즈', '로우 앵글', '얕은 피사계 심도' 같은 카메라 설정은 입체감과 감정적 분위기를 좌우합니다 [15-20].
주요 AI 모델별 프롬프트 전략 (Model-Specific Strategies) 각 플랫폼은 작동 방식과 이해하는 '방언'이 다르므로 맞춤형 전략이 필요합니다 [13, 21].
- 미드저니(Midjourney): 미학적이고 시네마틱한 결과물에 강하며 매개변수(Parameter)를 통한 제어가 필수적입니다 [22, 23]. 명령어 끝에 종횡비(
--ar), 양식화 강도(--stylize), 모델 버전(--v)을 붙이며, 스타일 참조(--sref), 캐릭터 참조(--cref), 옴니 참조(--oref) 기능으로 일관된 이미지를 생성할 수 있습니다 [22-26]. - DALL-E 3: 자연어 이해도가 탁월하여 키워드 나열보다는 대화형의 완전한 문장으로 지시하는 것이 유리합니다 [27-30]. 텍스트 렌더링에 강점이 있지만, 부정어("~없이")를 잘 이해하지 못하므로 피하고 싶은 요소 대신 '원하는 것'을 긍정형으로 묘사해야 합니다 [30-33].
- 스테이블 디퓨전(Stable Diffusion): 쉼표로 구분된 태그(Tag) 형태를 선호하며, 괄호와 숫자(
(keyword:1.2))를 이용한 단어별 가중치(Weight) 조절이 핵심 기술입니다 [34-37]. 모델의 편향이나 형태적 결함(예: 기형적인 손, 워터마크)을 막기 위해 긍정 프롬프트 못지않게 '부정 프롬프트(Negative Prompt)'를 적극적으로 활용해야 합니다 [34, 37-39].
프롬프트 엔지니어링 모범 사례 (Best Practices)
- 반복적 정교화(Iterative Refinement): 완벽한 프롬프트를 한 번에 쓰려 하지 말고, 단순한 기본 프롬프트로 시작한 뒤 생성된 결과를 바탕으로 조명, 구도, 세부 묘사를 추가하며 점진적으로 수정(Vary Region, Inpainting 등 활용)합니다 [8, 40-43].
- 구체성 확보 및 모순 방지: 50개가 넘는 세부 사항으로 모델을 과부하 시키거나 "사실적이면서 추상적인"과 같은 모순된 지시어를 사용하는 것을 피해야 합니다 [44, 45].
- 명확한 수치와 형용사 사용: "새들"보다는 "새 3마리"나 "새 떼"가 좋으며, 단순한 묘사보다 구체적인 형용사를 포함해야 AI가 작업할 힌트를 얻습니다 [46-48].
🔗 Knowledge Connections
- Related Topics: 프롬프트 엔지니어링 (Prompt Engineering), 부정 프롬프트 (Negative Prompt), 가중치 조절 (Prompt Weights), 미드저니 매개변수 (Midjourney Parameters), 생성형 AI (Generative AI)
- Projects/Contexts: AI 이미지 생성 및 편집 워크플로우 (AI Image Generation & Editing Workflow), 플랫폼별 프롬프트 최적화 (Platform-Specific Prompt Optimization)
- Contradictions/Notes: DALL-E 3는 "아무것도 없는", "~가 아닌" 등의 부정 지시어를 처리하는 데 취약하여 원치 않는 객체가 도리어 생성될 수 있으므로 모든 지시를 긍정형으로 작성해야 합니다[30, 32, 33]. 반면 Stable Diffusion은 원치 않는 요소(예: 손가락 변형, 저화질, 워터마크 등)를 명시적으로 차단하기 위해 '부정 프롬프트(Negative Prompt)' 섹션을 활용하는 것이 필수적이며 이미지 품질 향상에 직결됩니다[37, 39, 49, 50].
Last updated: 2026-04-30