4.6 KiB
4.6 KiB
파라미터 튜닝 (Parameter Tuning)
📌 Brief Summary
파라미터 튜닝은 AI 이미지 생성 과정에서 텍스트 프롬프트 외에 추가적인 명령어(매개변수)를 입력하여 결과물의 종횡비, 스타일 강도, 품질, 무작위성 등을 미세하게 조정하고 통제하는 과정이다 [1, 2]. 사용하는 AI 플랫폼(미드저니, 스테이블 디퓨전 등)에 따라 적용 가능한 매개변수와 구문(Syntax)이 다르며, 이를 적절히 제어해야 사용자의 의도에 완벽하게 부합하는 맞춤형 이미지를 생성할 수 있다 [3, 4].
📖 Core Content
-
파라미터의 정의 및 작성 규칙 매개변수(Parameter)는 텍스트 프롬프트로 묘사한 내용 뒤에 추가되어 이미지가 생성되는 방식을 설정하는 특별한 지시어이다 [1]. 미드저니(Midjourney)의 경우, 항상 프롬프트의 맨 끝에 이중 하이픈(
--)과 함께 입력하며, 프롬프트 텍스트와 하이픈 사이에 공백을 두어야 하고 쉼표 등의 구두점을 사용해서는 안 된다 [4, 5]. -
미드저니(Midjourney)의 주요 매개변수 미드저니는 강력한 미학적 제어를 위해 다양한 매개변수 체계를 제공한다 [6].
- 종횡비 (
--ar또는--aspect): 이미지의 가로세로 비율(예:--ar 16:9,--ar 3:2)을 변경한다 [4, 7, 8]. - 스타일라이즈 (
--s또는--stylize): 모델 고유의 예술적 개입 강도를 0에서 1000 사이의 수치로 조절하며, 값이 높을수록 예술적 해석이 강해지고 낮을수록 텍스트 지시에 더 충실해진다 [4, 6, 9, 10]. - 카오스 (
--c또는--chaos): 0에서 100 사이의 값으로 설정하며, 초기 생성되는 4장의 이미지 그리드에 변형과 무작위성을 부여하여 예측 불가능하고 다양한 결과물을 만들어낸다 [10, 11]. - 품질 (
--q또는--quality): 렌더링 시간과 디테일의 수준을 조절한다 [10, 12]. - 참조 매개변수: 캐릭터의 일관성을 유지하는 캐릭터 참조(
--cref), 시각적 무드나 색감을 적용하는 스타일 참조(--sref), 사물의 고유한 형태까지 기억해 반영하는 옴니 참조(--oref)가 있다 [6, 9, 13-16]. - 기타 제어: 초안을 빠르게 생성해 비용과 시간을 절약하는 드래프트 모드(
--draft), 특정 요소를 제거하는 부정 매개변수(--no), 스타일의 무작위 노이즈를 고정하는 시드(--seed) 등이 존재한다 [11, 12, 17-19].
- 종횡비 (
-
스테이블 디퓨전(Stable Diffusion)의 매개변수 제어 스테이블 디퓨전에서는 CFG(Classifier-Free Guidance) 스케일과 샘플링 스텝(sampling steps)을 조정하여 변동성을 제어한다 [20].
- CFG Scale: 생성 중인 이미지가 사용자의 프롬프트 조건을 얼마나 공격적으로 따를지(가이던스의 강도)를 결정하는 중요한 수치다 [21, 22].
- 프롬프트 가중치 (Prompt Weights): 괄호와 숫자를 사용한 문법(예:
(keyword:1.1))이나+,-기호를 추가하여 특정 단어의 중요도(강조 또는 축소)를 직접 숫자로 할당할 수 있다 [23-26]. 부정 프롬프트 또한 이 가중치 시스템을 적용하여 원치 않는 요소를 더 강하게 배제할 수 있다 [27, 28].
🔗 Knowledge Connections
- Related Topics: 미드저니 (Midjourney), 스테이블 디퓨전 (Stable Diffusion), 가중치 조절 (Prompt Weights), 부정 프롬프트 (Negative Prompts)
- Projects/Contexts: 일관된 브랜드 에셋이나 캐릭터 시리즈 제작 시 참조 매개변수(--cref, --sref, --oref)를 활용하는 워크플로우, 불필요한 시각적 아티팩트(예: 여분의 손가락, 워터마크 등)를 제거하기 위해 CFG 스케일 및 부정 프롬프트 가중치를 세밀하게 조정하는 작업
- Contradictions/Notes: AI 플랫폼에 따라 명령을 인식하는 구문 체계가 완전히 다르다. 미드저니는 주로 명령어 끝에
--기호로 파라미터를 추가하여 제어하는 반면 [4, 5], 스테이블 디퓨전 등은(word:1.5)나[word]와 같이 괄호와 숫자 가중치를 텍스트 내부에 직접 결합하여 파싱(Parsing)하는 방식을 사용하므로 플랫폼에 맞는 문법 숙지가 필수적이다 [27, 29].
Last updated: 2026-04-30