28 lines
4.2 KiB
Markdown
28 lines
4.2 KiB
Markdown
# [[프롬프트 엔지니어링 (Prompt Engineering)]]
|
|
|
|
## 📌 Brief Summary
|
|
프롬프트 엔지니어링은 인공지능 이미지 생성 모델에게 **사용자의 추상적인 언어적 의도를 기계가 해석 가능한 구체적 시각 좌표로 번역하는 기술적 과정**이다 [1]. 단순한 단어의 나열을 넘어 주체, 스타일, 조명, 구도 등의 시각적 요소를 체계적으로 구성하여 원하는 결과물을 도출한다 [1-3]. 미드저니(Midjourney), DALL-E 3, 스테이블 디퓨전(Stable Diffusion) 등 **각 AI 모델의 고유한 아키텍처와 '방언'을 이해하고 이에 맞춘 전략적인 지시어를 작성하는 것**이 핵심이다 [4, 5].
|
|
|
|
## 📖 Core Content
|
|
|
|
* **프롬프트의 핵심 구성 요소**
|
|
성공적인 이미지 프롬프트는 일반적으로 **주체(Subject), 매체/스타일(Medium/Style), 환경(Environment), 조명(Lighting), 구도(Composition), 그리고 기술적 매개변수(Parameters)**의 층위로 구성된다 [1, 3, 6].
|
|
* 주체는 단순 명사보다 상황적 맥락을 포함하여 구체적으로 묘사해야 하며, 매체와 스타일(예: 유화, 35mm 필름 사진, 사이버펑크)을 명시하여 이미지의 전반적인 질감을 결정한다 [7].
|
|
* 카메라 렌즈(예: 85mm, 얕은 피사계 심도)나 조명 기법(예: 골든 아워, 치아로스쿠로, 볼륨메트릭 라이팅)과 같은 **시각적 전문 용어를 사용**하면 인공지능이 학습한 특정 데이터 영역을 자극하여 훨씬 사실적이고 깊이 있는 이미지를 생성할 수 있다 [8-10].
|
|
|
|
* **주요 플랫폼별 프롬프트 패러다임**
|
|
각 생성 모델은 각기 다른 메커니즘을 지니고 있어 특화된 접근이 필요하다 [5].
|
|
* **미드저니(Midjourney):** 시네마틱하고 예술적인 미학에 강점이 있으며, 전용 매개변수를 활용한 수치적 제어가 중요하다. `--ar`(종횡비), `--stylize`(예술적 개입 강도), `--sref`(스타일 참조), `--cref`(캐릭터 참조) 등을 프롬프트 끝에 덧붙여 결과물을 세밀하게 통제한다 [11-14].
|
|
* **DALL-E 3:** 자연어 이해도가 높고 GPT-4와 상호작용하며 복잡한 다중 객체 배치나 정확한 텍스트 렌더링에 탁월하다 [15]. 하지만 시적이고 장황한 언어보다는 **짧고 명확하며 그래픽 중심적인 언어**가 효과적이다 [16, 17].
|
|
* **스테이블 디퓨전(Stable Diffusion):** 프롬프트 내 **가중치(Prompt Weights)**를 `(keyword:1.2)` 형태로 표기하여 특정 단어의 중요도를 세밀하게 조정할 수 있다 [18-20]. 또한 기형적인 손가락이나 워터마크 등 원치 않는 요소를 배제하기 위해 '부정 프롬프트(Negative Prompt)'를 적극적으로 활용하는 것이 필수적이다 [20-22].
|
|
|
|
* **반복적 정교화와 사후 편집(Iterative Refinement)**
|
|
프롬프트 작성은 한 번에 끝나는 단발성 행위가 아니라 생성된 이미지를 바탕으로 점진적으로 수정해 나가는 협업 과정이다 [23-26]. 미드저니의 **Vary Region(인페인팅)** 기능을 통해 이미지 전체를 유지하며 특정 부분만 수정하거나, **Zoom Out(아웃페인팅)**으로 캔버스 밖의 시야를 논리적으로 확장하는 등 프롬프트 기반의 세부 편집이 필수적으로 수반된다 [26-28].
|
|
|
|
## 🔗 Knowledge Connections
|
|
- **Related Topics:** [[Negative Prompt]], [[Prompt Weights]], [[Lighting & Composition]], [[Model Parameters]]
|
|
- **Projects/Contexts:** [[미드저니 매개변수 제어 및 스타일 참조(Style Reference)]], [[DALL-E 3 대화형 프롬프트 생성]], [[스테이블 디퓨전 아티팩트 디버깅(Artifact Debugging)]]
|
|
- **Contradictions/Notes:** DALL-E 3는 "없는(no, without)"과 같은 부정 지시어 처리에 약점이 있어 원치 않는 요소를 피하려면 반드시 긍정형 문장으로 원하는 속성만 묘사해야 한다 [15, 29, 30]. 반면, 스테이블 디퓨전(Stable Diffusion)은 출력물 최적화 및 오류(기형적인 신체, 워터마크 등) 차단을 위해 '부정 프롬프트(Negative Prompt)'의 명시적이고 적극적인 사용이 필수적이라는 점에서 상반된 접근법을 요구한다 [20, 21, 31].
|
|
|
|
---
|
|
*Last updated: 2026-04-30* |