Files
2nd/10_Wiki/Topics/Midjourney.md
T

4.7 KiB

Midjourney

📌 Brief Summary

Midjourney는 텍스트 프롬프트를 상세한 이미지, 일러스트레이션 및 예술 작품으로 변환해 주는 강력한 AI 기반 이미지 생성 도구이다 [1]. 주로 디스코드(Discord)의 /imagine 명령어 또는 전용 웹 인터페이스를 통해 사용되며, 최신 모델인 V6 및 V7을 바탕으로 영화 같은 조명과 예술적 미학이 돋보이는 고품질 결과물을 제공한다 [1-3]. 사용자는 텍스트뿐만 아니라 고유의 매개변수(Parameters)와 이미지 참조(Reference) 기능을 활용하여 결과물의 스타일, 구도, 일관성을 정교하게 제어할 수 있다 [4-6].

📖 Core Content

  • 프롬프트 기본 구조 및 작성 팁

    • Midjourney의 효과적인 프롬프트는 일반적으로 [주제(Subject)] + [행동/배경(Action/Setting)] + [스타일/아티스트(Style/Artist)] + [세부사항(Details/Modifiers)] + [--매개변수(Parameters)]의 구조를 따른다 [6, 7].
    • 공식 문서에 따르면 짧고 명확한 프롬프트가 종종 최상의 결과를 내며, 불필요하게 긴 지시문이나 모호한 단어보다는 구체적인 동의어와 정확한 수량(예: "cats" 대신 "three cats")을 명시하는 것이 유리하다 [8, 9].
    • 원하지 않는 요소를 배제할 때는 "without" 같은 부정어보다 --no 매개변수(Negative Prompt)를 사용하는 것이 훨씬 효과적이다 [9, 10].
  • 핵심 제어 매개변수 (Parameters)

    • --ar (Aspect Ratio): 이미지의 종횡비를 설정한다 (예: --ar 16:9, --ar 3:2) [4, 5, 11, 12].
    • --stylize 또는 --s: 모델의 기본 예술적 스타일을 얼마나 강하게 적용할지(0~1000) 결정한다. 값이 높을수록 미학적으로 과장되며, 낮을수록 입력한 텍스트에 문자 그대로 충실해진다 [4, 11-14].
    • --style raw: Midjourney 특유의 기본 미학(beautification)을 줄이고 보다 사진(photographic)에 가깝고 사실적인 결과물을 원할 때 추가한다 [11, 12, 15].
    • --chaos 또는 --c: 초기 생성되는 4장의 이미지 간의 다양성과 무작위성을 높인다(0~100) [11, 12, 16].
  • 참조(Reference) 기능을 통한 일관성 유지

    • 캐릭터 참조 (--cref, --cw): 특정 이미지 URL을 참조하여 캐릭터의 얼굴이나 의상 등 시각적 정체성을 여러 프롬프트에 걸쳐 일관되게 유지한다 [12, 14, 17-19].
    • 스타일 참조 (--sref, --sw): 특정 이미지의 색상 팔레트, 무드보드, 예술적 스타일을 복제하여 새로운 프롬프트에 적용한다 [12, 17, 19-21].
    • 옴니 참조 (--oref): V7 모델에서 도입된 기능으로, 캐릭터뿐만 아니라 사물의 고유한 형태적 정체성까지 기억해 다른 환경에서도 동일한 피사체를 재현할 수 있다 [19, 20, 22-24].
  • 수정 및 최신 워크플로우 (V7 기준)

    • 드래프트 모드 (--draft): V7에 추가된 기능으로, 표준 생성보다 10배 빠르고 훨씬 적은 GPU 비용으로 시안을 대량 생성한다. 먼저 저비용으로 여러 프롬프트와 구도를 테스트한 뒤, 마음에 드는 시안을 고화질로 승격시키는 효율적인 작업 방식이 권장된다 [20, 25-28].
    • Vary Region (인페인팅): 생성된 이미지의 전체적인 틀은 유지한 채, 선택한 특정 영역(예: 모자를 왕관으로 변경)에 대해서만 새로운 프롬프트를 적용하여 부분 수정할 수 있다 [29-37].

🔗 Knowledge Connections

  • Related Topics: Negative Prompt, Style Reference, Parameter, Prompt Structure
  • Projects/Contexts: V7 Draft Mode Workflow, Image Inpainting (Vary Region), Character Consistency
  • Contradictions/Notes:
    • Midjourney는 예술적이고 영화적인 시각화에는 압도적인 성능을 보이지만, 정확한 타이포그래피(텍스트 삽입)나 엄격한 레이아웃 제어에서는 DALL-E 3에 비해 약점이 있다는 평가가 존재한다 [38-40]. (다만, 최근 V7에서는 따옴표 안의 텍스트를 99% 정확하게 렌더링하는 기능이 크게 향상되었다 [22]).
    • 공식 문서에서는 "짧고 단순한 프롬프트"가 기본 미학을 살리는 데 좋다고 권장하지만 [8, 41], 동시에 상업적이고 통제된 결과물을 얻기 위해서는 주제, 환경, 조명, 스타일 등을 계층적으로 조합하는 구체적인 프롬프트 구조가 필수적이라는 조언이 공존한다 [6, 7, 25, 42].

Last updated: 2026-04-30