4.1 KiB
4.1 KiB
프롬프트 엔지니어링 미세 조정
📌 Brief Summary
프롬프트 엔지니어링 미세 조정은 초기 텍스트 프롬프트로 생성된 이미지를 분석하고, 원하는 시각적 결과물에 완벽히 부합하도록 지시어를 점진적으로 수정 및 정교화하는 과정입니다 [1, 2]. 단순한 단어의 나열을 넘어 가중치 조절, 부정 프롬프트 활용, 플랫폼 특화 매개변수 설정 등을 통해 픽셀 단위까지 결과물을 통제합니다 [3, 4]. 이 과정을 통해 사용자는 무작위성을 줄이고, AI 모델이 일관성 있고 의도된 미학을 구현하도록 정밀하게 안내할 수 있습니다 [5, 6].
📖 Core Content
- 반복적 정교화 (Iterative Refinement): 프롬프트 작성은 단발성 행위가 아니라 모델과의 반복적인 협업 과정입니다 [2]. 초기에는 주체와 매체 등 핵심만을 담은 단순한 프롬프트로 시작하여 모델에 창의적 여지를 주고, 이후 조명, 구도, 스타일 등의 세부 요소를 3~5회에 걸쳐 점진적으로 덧붙이거나 수정하며 완벽한 이미지를 찾아가는 것이 핵심입니다 [7-10].
- 가중치 제어 (Prompt Weights): 특정 단어나 구문의 중요도를 수학적으로 조절하여 결과물 내 특정 요소의 비중을 세밀하게 타협하는 기술입니다 [11, 12]. 스테이블 디퓨전(Stable Diffusion)에서는
(keyword:factor)형태나 괄호()를 사용하여 가중치를 높이거나 낮출 수 있으며(예:(dog:1.5)또는[dog]) [4, 13, 14], 미드저니(Midjourney)에서는::뒤에 숫자를 붙여 개념의 강도를 조절합니다 [15, 16]. - 부정 프롬프트 활용 (Negative Prompts): 생성된 이미지에서 원하지 않는 요소(예: 워터마크, 왜곡된 손, 원치 않는 3D 렌더링 스타일 등)를 배제하여 품질을 최적화하는 강력한 통제 수단입니다 [17-19]. 모호하게 '나쁜(bad)'이라고 쓰기보다 '기형적인 눈', '추가된 손가락'과 같이 구체적이고 물리적인 명사로 묘사해야 효과적이며 [20, 21], 미드저니에서는
--no매개변수로 이를 구현합니다 [16, 22]. - 매개변수(Parameter)를 통한 전역적 통제: 텍스트 뒤에 붙는 특수 명령어로 이미지의 기술적, 미학적 틀을 결정합니다. 미드저니의 경우 종횡비(
--ar), 예술적 개입 강도(--stylize또는--s), 결과물의 다양성(--chaos또는--c), 기이함(--weird) 등을 세밀하게 조절할 수 있습니다 [3, 23-27]. - 국소적 영역 변주 및 확장 (Inpainting / Outpainting): 전체 이미지를 다시 생성하지 않고, 이미지의 완벽성을 높이기 위해 부분만 덧칠하는 기술입니다 [28]. 미드저니의 Vary (Region) 기능과 리믹스(Remix) 모드를 함께 사용하면 기존 맥락을 완벽히 유지한 채 모자를 왕관으로 바꾸거나 배경에 새로운 요소를 정교하게 픽셀 단위로 합성할 수 있습니다 [2, 29-32].
🔗 Knowledge Connections
- Related Topics: 가중치 제어(Prompt Weights), 부정 프롬프트(Negative Prompt), 매개변수 설정(Parameters), 인페인팅 및 영역 변주(Inpainting/Vary Region)
- Projects/Contexts: 초기 생성 이미지의 반복적 개선 및 디버깅 작업, 상업용 AI 아트 및 일관성 있는 브랜드 이미지 제작
- Contradictions/Notes: DALL-E 3 모델은 "no", "without", "don't"과 같은 부정 지시어(Negation)를 잘 처리하지 못하고 오히려 그 단어를 인식해 원치 않는 요소를 이미지에 포함시키는 경향이 있으므로 항상 '원하는 긍정적 속성' 위주로 서술해야 합니다 [33-35]. 반면, 스테이블 디퓨전과 미드저니(예:
--no파라미터)에서는 부정 프롬프트가 아티팩트(결함)를 제거하고 품질을 높이는 필수적이고 효과적인 수단으로 작동합니다 [5, 16, 17].
Last updated: 2026-04-30