Files
2nd/10_Wiki/Topics_Art/Prompt Engineering.md
T

4.4 KiB

Prompt Engineering

📌 Brief Summary

프롬프트 엔지니어링은 인간의 추상적인 의도와 아이디어를 인공지능이 이해할 수 있는 구체적인 시각적 기호로 번역하는 정교한 작업이다 [1, 2]. 단순한 단어의 나열을 넘어 주체, 매체, 스타일, 조명, 기술적 매개변수 등을 전략적으로 조합하여 AI 모델(Midjourney, DALL-E 3, Stable Diffusion 등)을 제어하는 청사진 역할을 한다 [3, 4]. 훌륭한 프롬프트는 AI 시스템의 고유한 '방언'과 아키텍처를 이해하고 이를 바탕으로 원하는 시각적 결과물을 정확하게 도출해 내는 과정이다 [5, 6].

📖 Core Content

  • 프롬프트의 핵심 구성 요소: 고품질의 이미지를 생성하는 프롬프트는 일반적으로 4~5가지 계층 구조를 갖는다 [2, 7]. 먼저 명확한 초점이 되는 '주체(Subject)'를 설정하고, 주체가 존재하는 '환경/맥락(Context/Environment)'을 부여한다 [4, 8, 9]. 이후 '스타일 및 매체(Style & Medium)'를 통해 유화, 3D 렌더링, 사진 등 예술적 형식을 결정하며, 마지막으로 피사체를 비추는 '조명(Lighting)'과 '카메라 앵글(Camera Perspectives)' 등 기술적 디테일을 추가하여 완성도를 높인다 [4, 9, 10].

  • 주요 AI 모델별 프롬프트 메커니즘:

    • Midjourney (미드저니): 시네마틱한 완성도와 예술적 미학이 강점이며 [11, 12], /imagine 명령어 뒤에 텍스트를 입력하고 --ar(종횡비), --v(버전), --stylize(예술적 강도)와 같은 고유의 기술 매개변수(Parameters)를 덧붙여 제어한다 [13-16]. 최신 버전(V6, V7)에서는 --sref(스타일 참조), --cref(캐릭터 참조), --oref(옴니 참조) 등을 통해 이미지의 일관성과 정체성을 완벽하게 유지할 수 있다 [12, 17-20].
    • DALL-E 3: ChatGPT의 언어 모델(LLM)과 통합되어 대화형 자연어 지시를 매우 잘 이해한다 [21-23]. 사용자의 짧은 프롬프트를 자동으로 확장하여 배경과 피사체 간의 관계를 상세히 묘사하므로, 이미지 내 텍스트 렌더링이나 복잡한 맥락 구현에 탁월하다 [11, 23, 24].
    • Stable Diffusion (스테이블 디퓨전): 쉼표로 구분된 태그(키워드) 방식의 문법을 사용하며, 특정 단어의 중요도를 괄호와 숫자(예: (keyword:1.2))로 조절하는 가중치(Prompt Weights) 제어가 필수적이다 [25-27]. 특히, 이미지 생성 과정에서 배제할 요소를 지정하는 부정 프롬프트(Negative Prompt)를 통해 해부학적 오류(예: 일그러진 손가락)나 원치 않는 스타일을 방지하는 것이 핵심 기술이다 [28-30].
  • 프롬프트 작성의 최적 실무 (Best Practices):

    • 구체적이고 명확한 언어 사용: 모호한 형용사나 상충되는 지시어(예: "사실적인 애니메이션")를 피하고, "85mm 렌즈", "골든 아워", "치아로스쿠로(Chiaroscuro)" 등 전문적인 시각/조명 용어를 사용해야 모델이 정확한 픽셀 패턴을 도출할 수 있다 [31-34].
    • 반복적 정교화 (Iterative Refinement): 한 번에 완벽한 결과를 기대하기보다는, 간단한 뼈대 프롬프트로 시작하여 결과를 분석한 뒤 필요한 디테일을 추가하거나 수정해 나가는 점진적 개선 과정이 중요하다 [35-38].

🔗 Knowledge Connections


Last updated: 2026-04-30