Files
2nd/10_Wiki/Topics_Art/AI 이미지 생성 워크플로우 (AI Image Generation Workflow).md
T

5.1 KiB

AI 이미지 생성 워크플로우 (AI Image Generation Workflow)

📌 Brief Summary

AI 이미지 생성 워크플로우는 창작자가 텍스트 프롬프트를 입력하여 초기 이미지를 생성한 후, 반복적인 수정과 세부 조정을 통해 최종 결과물을 완성하는 일련의 과정이다 [1-3]. 이 과정은 명확한 피사체(Subject), 스타일, 조명 등의 뼈대를 잡는 단순한 프롬프트로 시작하여, 결과물을 평가한 뒤 점진적으로 부정 프롬프트(Negative Prompt)와 세부 매개변수를 추가하며 발전시킨다 [4-6]. 최근에는 단일 이미지 생성을 넘어 시안(Draft)을 빠르게 대량 생산하고 최적의 구도를 선택하거나, 일관된 스타일 참조 기능을 활용하는 등 전문가 수준의 파이프라인으로 진화하고 있다 [7, 8].

📖 Core Content

  • 반복적 프롬프트 정교화 (Iterative Prompting): AI 이미지 생성은 단 한 번의 완벽한 프롬프트로 끝나는 것이 아니라, 넓고 모호한 지시에서 시작해 구체적이고 좁은 지시로 나아가는 고도의 반복적 과정이다 [1-3]. 단순하고 명확한 아이디어로 시작해 생성된 이미지를 바탕으로 예술적 요소, 조명, 환경 등의 세부 사항을 덧붙이는 방식이 권장된다 [4, 9]. 일반적으로 첫 프롬프트로 80%의 틀을 완성하고, 3~5번의 변형과 후속 프롬프트를 통해 세부 사항을 다듬어 나간다 [10].
  • 모델별 맞춤형 워크플로우 전략:
    • Midjourney: V7 모델의 '드래프트 모드(Draft Mode)'를 활용해 저렴하고 빠른 속도로 여러 시안을 생성한 뒤, 가장 나은 구도를 고화질(HD)로 승격시키는 파이프라인이 비용과 시간 측면에서 효과적이다 [7, 11]. 이후 --sref(스타일 참조)나 --oref(옴니 참조) 파라미터를 사용하여 일관된 시각적 방향성을 재사용하며 편집을 진행한다 [8, 12, 13].
    • DALL-E 3: 사용자의 짧은 프롬프트를 ChatGPT의 언어 모델이 자동으로 상세하게 확장(Augment)해 주는 특징이 있다 [14-16]. 텍스트 렌더링 능력이 뛰어나 로고나 포스터 제작에 적합하지만, 사용자의 의도를 그대로 반영하려면 "프롬프트를 변경하지 말고 그대로 사용할 것"이라는 명시적인 지시가 필요할 수 있다 [16-18].
    • Stable Diffusion: 프롬프트 가중치(Prompt Weights)와 부정 프롬프트(Negative Prompt)를 핵심 통제 수단으로 사용한다 [19-21]. 결과물의 결함을 진단한 뒤, 5-10개의 구체적인 단어를 부정 프롬프트에 명시하여 원치 않는 요소를 제거해 나가는 방식이 필수적이다 [6, 22-24].
  • 사후 편집 및 이미지 확장: 원하는 결과물의 분위기에 근접했을 경우, 프롬프트 전체를 갈아엎기보다는 사후 편집 도구를 사용하는 것이 효율적이다 [1, 25]. 인페인팅(Inpainting, 미드저니의 Vary Region 등) 기능을 사용하면 원본 이미지의 맥락을 유지한 채 특정 부분(예: 인물의 모자 등)만 선택해 수정하거나 새로운 요소를 추가할 수 있다 [26-30]. 또한 아웃페인팅(Zoom Out, Pan)을 통해 원본 이미지의 바깥쪽 공간을 확장하여 캔버스를 넓히고 구도를 재설정할 수 있다 [30-32].
  • 프롬프트의 계층적 구성 요소: 성공적인 워크플로우를 위한 프롬프트는 논리적인 계층 구조를 가진다. 일반적으로 주체(Subject), 맥락/환경(Context/Environment), 스타일/매체(Style/Medium), 기술적 세부사항(Technical Details: 구도 및 조명)의 순서나 결합으로 구성하여 AI가 우선순위를 쉽게 파악할 수 있도록 돕는다 [5, 33, 34].

🔗 Knowledge Connections


Last updated: 2026-04-30