3.5 KiB
프롬프트 엔지니어링 (Prompt Engineering)
📌 Brief Summary
프롬프트 엔지니어링은 인간의 언어적 의도를 AI 모델이 해석 가능한 시각적 기호와 픽셀로 변환하는 정교한 작업입니다 [1]. 초기 모델이 단순 키워드 나열에 의존했다면, 현대의 프롬프트는 주체, 스타일, 환경, 조명 등을 포함한 계층적 구조를 갖춘 '시각적 의사소통의 프로토콜'로 진화했습니다 [1, 2]. 다가오는 미래에는 창작자가 비전만 제시하면 AI 에이전트가 이를 최적의 기술 언어로 번역하는 '에이전틱 크리에이티브(Agentic Creative)' 시대로의 패러다임 전환이 이루어지고 있습니다 [1, 3].
📖 Core Content
-
프롬프트의 계층적 구조 훌륭한 이미지 프롬프트는 대체로 5가지 핵심 층위로 구성됩니다: 주체(Subject), 매체 및 스타일(Medium/Style), 환경(Environment), 조명(Lighting), 기술 매개변수(Parameters) [1, 4, 7, 8]. 주체에 대해서는 "등대"와 같은 단일 명사보다 "폭풍우 치는 바위 절벽 위에 있는 풍화된 등대"처럼 상황적 맥락을 포함한 구체적 묘사가 필수적입니다 [9-11].
-
모델별 프롬프트 패러다임
- Midjourney: 시네마틱한 미학 제어에 강하며, 종횡비(
--ar), 스타일 참조(--sref), 캐릭터 참조(--cref), 옴니 참조(--oref) 등의 매개변수를 통해 일관성을 강력하게 통제합니다 [1, 7, 24-28]. - DALL-E 3: 자연어 이해력이 탁월하여 문장 형태의 서술이 유리합니다. 내장된 GPT 모델이 짧은 지시를 상세 묘사로 자동 확장(Expansion)하지만, 부정 지시어(~하지 마라)를 잘 이해하지 못하므로 모든 지시는 긍정형 문장으로 구성해야 합니다 [1, 9, 10, 29-31].
- Stable Diffusion:
(키워드:가중치)형식의 세밀한 가중치 조절과 부정 프롬프트(Negative Prompt)가 핵심입니다. 모델을 직접 훈련시키거나 하드웨어 수준에서 정밀 제어가 가능합니다 [1, 11, 23, 32-34].
- Midjourney: 시네마틱한 미학 제어에 강하며, 종횡비(
-
반복적 정교화와 워크플로우 최신 프롬프트 엔지니어링은 단발성 입력이 아닌, 인페인팅(Vary Region)이나 줌 아웃(Zoom Out) 등을 통한 점진적 협업을 강조합니다. 특히 미드저니 V7의 '드래프트 모드(Draft Mode)'는 대량의 시안을 신속히 생성하게 하여 '연속적 창작 및 검토 루프(Review loop)'로의 혁신을 가져왔습니다 [1, 13, 14].
⚖️ Trade-offs & Caveats
- 부정 프롬프트의 모델별 차이: DALL-E 3는 부정어를 이해하지 못해 긍정형 우회 전략이 필요하지만, Stable Diffusion은 명시적 네거티브 프롬프트를 통해 결함을 배제하는 방식을 사용합니다 [1, 10, 12].
- 과도한 가중치와 디테일의 위험: 너무 많은 디테일 나열이나 2.0 이상의 극단적 가중치는 모델의 기본 구조를 왜곡할 수 있으므로, 핵심적인 5~10가지 요소에 집중하는 것이 효과적입니다 [12, 38, 39].
🔗 Knowledge Connections
- Related Topics: 부정 프롬프트 (Negative Prompt), 확산 모델 (Diffusion Models), 매개변수 및 이미지 참조 기능 (Parameters & Reference Features
- Projects/Contexts: 에이전틱 크리에이티브 (Agentic Creative, AI 이미지 생성 모델 파라미터 제어
Last updated: 2026-04-30