Files
2nd/10_Wiki/Topics/프롬프트 엔지니어링.md
T

4.5 KiB

프롬프트 엔지니어링

📌 Brief Summary

프롬프트 엔지니어링은 인간의 언어적 의도를 기계가 해석 가능한 시각적 기호와 픽셀로 변환하는 정교한 작업이다 [1]. 효과적인 이미지 프롬프트는 단순한 단어의 나열이 아니라 주체, 스타일, 환경, 조명 등을 명확히 지시하여 AI가 원하는 결과물을 도출할 수 있도록 돕는 청사진 역할을 한다 [2, 3]. 성공적인 이미지 생성은 한 번의 입력으로 끝나는 것이 아니라, 명확한 구조를 바탕으로 모델의 특성에 맞게 지시어를 반복적으로 수정하고 정교화하는 과정을 거친다 [4-6].

📖 Core Content

  • 프롬프트의 핵심 구조 훌륭한 이미지 프롬프트는 일관된 계층적 구조를 가진다. 주로 주체(Subject), 환경 및 맥락(Context), 스타일과 매체(Style/Medium), 조명 및 색상(Lighting/Color), 그리고 기술적 매개변수(Technical Details/Parameters)의 층위로 구성된다 [1, 3, 7, 8].

  • 주체 및 세부 묘사 (Subject & Context) 모호한 단어보다는 구체적이고 특징적인 묘사가 필요하다. 예를 들어 "등대"라고만 적기보다 "폭풍우 치는 바위 절벽 위에 있는 풍화된 등대"와 같이 상황적 맥락과 형용사를 포함해야 AI가 더 정확한 형태와 서사를 구현할 수 있다 [9-11]. 너무 많은 디테일을 나열하기보다는 핵심적인 5~10가지 요소에 집중하는 것이 좋다 [12].

  • 스타일 및 조명 설정 (Style & Lighting) 이미지의 질감과 분위기를 결정짓는 가장 강력한 도구 중 하나다. '35mm 필름 사진', '수채화', '사이버펑크' 같은 매체 지정과 '골든 아워', '시네마틱 조명'과 같은 구체적인 조명 묘사가 필수적이다 [7, 11, 13-15]. 조명 지시가 명확하지 않으면 AI는 평면적이고 안전한 기본 조명을 적용하여 이미지의 깊이감과 무드를 잃게 된다 [16-18].

  • 부정 프롬프트(Negative Prompt)의 활용 이미지에 포함되지 않기를 바라는 요소는 긍정 프롬프트 내에 "No"나 "Without"으로 기재하기보다는, 전용 부정 프롬프트 기능을 사용하거나 가중치를 조절해 제거해야 한다 [19, 20]. 특히 "나쁜 품질"과 같은 포괄적인 단어보다 "여섯 개의 손가락", "워터마크", "어긋난 시선"처럼 피해야 할 구체적인 결함을 지시하는 것이 훨씬 효과적이다 [21-23].

  • 플랫폼별 맞춤형 접근 전략

    • Midjourney: 예술적이고 시네마틱한 미학에 강하며, 정교한 제어를 위해 매개변수 활용이 필수적이다 [24-26]. 최근 버전에서는 --sref (스타일 참조), --oref (옴니 참조), --cref (캐릭터 참조)를 통해 이미지의 일관성을 강력하게 통제할 수 있다 [26-28].
    • DALL-E 3: 대화형 자연어 이해력이 뛰어나며, 복잡한 다중 객체의 배치나 텍스트 렌더링에 유리하다 [29-31]. 단, 부정적인 지시어(예: "~하지 마라")를 잘 이해하지 못하므로 원하는 바를 긍정형 문장으로 구성해야 한다 [19, 31].
    • Stable Diffusion: (키워드:1.5) 형식의 프롬프트 가중치 조절과 부정 프롬프트의 적극적인 활용이 핵심이다 [23, 32, 33]. 모델을 직접 훈련시키고 하드웨어 수준에서 세밀한 제어가 가능하다 [23, 34].

🔗 Knowledge Connections

  • Related Topics: 부정 프롬프트 (Negative Prompt), 디퓨전 모델 (Diffusion Models)
  • Projects/Contexts: 플랫폼별 AI 이미지 생성 (Midjourney, DALL-E 3, Stable Diffusion)
  • Contradictions/Notes: DALL-E 모델 등에서 "photorealistic(실사 같은)"이라는 단어를 사용하면 오히려 에어브러시로 그린 듯한 인위적인 미술 스타일이 촉발될 수 있다. 실제 사진과 같은 결과물을 원할 때는 "photo style(사진 스타일)"이나 특정 카메라 렌즈 사양을 명시하는 것이 낫다는 경험적 사례가 있다 [35-37]. 또한, 부정 프롬프트를 사용할 때 생성 초기부터 과도한 가중치를 부여하면 오히려 이미지의 기본 구조가 왜곡될 수 있으므로 표적화된 적은 수의 키워드만 사용하는 것이 좋다 [38, 39].

Last updated: 2026-04-30