Files
2nd/10_Wiki/Topics/프롬프트 엔지니어링 (Prompt Engineering).md
T

4.2 KiB

프롬프트 엔지니어링 (Prompt Engineering)

📌 Brief Summary

프롬프트 엔지니어링은 인공지능 이미지 생성 모델에게 사용자의 추상적인 언어적 의도를 기계가 해석 가능한 구체적 시각 좌표로 번역하는 기술적 과정이다 [1]. 단순한 단어의 나열을 넘어 주체, 스타일, 조명, 구도 등의 시각적 요소를 체계적으로 구성하여 원하는 결과물을 도출한다 [1-3]. 미드저니(Midjourney), DALL-E 3, 스테이블 디퓨전(Stable Diffusion) 등 각 AI 모델의 고유한 아키텍처와 '방언'을 이해하고 이에 맞춘 전략적인 지시어를 작성하는 것이 핵심이다 [4, 5].

📖 Core Content

  • 프롬프트의 핵심 구성 요소 성공적인 이미지 프롬프트는 일반적으로 **주체(Subject), 매체/스타일(Medium/Style), 환경(Environment), 조명(Lighting), 구도(Composition), 그리고 기술적 매개변수(Parameters)**의 층위로 구성된다 [1, 3, 6].

    • 주체는 단순 명사보다 상황적 맥락을 포함하여 구체적으로 묘사해야 하며, 매체와 스타일(예: 유화, 35mm 필름 사진, 사이버펑크)을 명시하여 이미지의 전반적인 질감을 결정한다 [7].
    • 카메라 렌즈(예: 85mm, 얕은 피사계 심도)나 조명 기법(예: 골든 아워, 치아로스쿠로, 볼륨메트릭 라이팅)과 같은 시각적 전문 용어를 사용하면 인공지능이 학습한 특정 데이터 영역을 자극하여 훨씬 사실적이고 깊이 있는 이미지를 생성할 수 있다 [8-10].
  • 주요 플랫폼별 프롬프트 패러다임 각 생성 모델은 각기 다른 메커니즘을 지니고 있어 특화된 접근이 필요하다 [5].

    • 미드저니(Midjourney): 시네마틱하고 예술적인 미학에 강점이 있으며, 전용 매개변수를 활용한 수치적 제어가 중요하다. --ar(종횡비), --stylize(예술적 개입 강도), --sref(스타일 참조), --cref(캐릭터 참조) 등을 프롬프트 끝에 덧붙여 결과물을 세밀하게 통제한다 [11-14].
    • DALL-E 3: 자연어 이해도가 높고 GPT-4와 상호작용하며 복잡한 다중 객체 배치나 정확한 텍스트 렌더링에 탁월하다 [15]. 하지만 시적이고 장황한 언어보다는 짧고 명확하며 그래픽 중심적인 언어가 효과적이다 [16, 17].
    • 스테이블 디퓨전(Stable Diffusion): 프롬프트 내 **가중치(Prompt Weights)**를 (keyword:1.2) 형태로 표기하여 특정 단어의 중요도를 세밀하게 조정할 수 있다 [18-20]. 또한 기형적인 손가락이나 워터마크 등 원치 않는 요소를 배제하기 위해 '부정 프롬프트(Negative Prompt)'를 적극적으로 활용하는 것이 필수적이다 [20-22].
  • 반복적 정교화와 사후 편집(Iterative Refinement) 프롬프트 작성은 한 번에 끝나는 단발성 행위가 아니라 생성된 이미지를 바탕으로 점진적으로 수정해 나가는 협업 과정이다 [23-26]. 미드저니의 Vary Region(인페인팅) 기능을 통해 이미지 전체를 유지하며 특정 부분만 수정하거나, **Zoom Out(아웃페인팅)**으로 캔버스 밖의 시야를 논리적으로 확장하는 등 프롬프트 기반의 세부 편집이 필수적으로 수반된다 [26-28].

🔗 Knowledge Connections


Last updated: 2026-04-30