Files
2nd/10_Wiki/Topics_Blog/Character Consistency.md
T

4.2 KiB

Character Consistency

📌 Brief Summary

캐릭터 일관성(Character Consistency)은 AI 이미지 및 비디오 생성 시 동일한 인물이나 객체의 외형적 정체성을 여러 생성 결과물에 걸쳐 동일하게 유지하는 기법을 의미합니다[1, 2]. 주로 스토리텔링, 만화 제작, 브랜드 마케팅 등에서 일관된 시각적 서사를 구축할 때 필수적으로 요구됩니다[3-5]. 모델에 따라 특화된 피사체 참조 파라미터(예: --cref, --oref)를 활용하거나, 프롬프트의 스타일 묘사 및 시드(seed) 번호를 통일하는 방식으로 구현할 수 있습니다[6, 7].

📖 Core Content

  • 미드저니(Midjourney)의 피사체 참조 기능(cref 및 oref) 미드저니 V6에서는 동일한 피사체의 시각적 정체성을 유지하기 위해 --cref(Character Reference) 파라미터가 도입되었습니다[1, 8]. 사용자는 이미지 URL과 함께 캐릭터 참조 강도를 조절하는 --cw(Character Weight) 값을 0에서 100 사이로 설정할 수 있습니다[2]. --cw 0으로 설정하면 캐릭터의 얼굴에 집중하고, --cw 100으로 설정하면 얼굴뿐만 아니라 의상과 머리 모양까지 포함하여 복제합니다[2]. 2026년에 기본 모델이 된 V7에서는 이를 더욱 확장한 --oref(Omni Reference) 기능이 도입되었습니다[9, 10]. 옴니 참조는 캐릭터뿐만 아니라 특정 커스텀 자동차나 보석 같은 객체의 형태적 정체성까지 넓은 범위에서 동일하게 유지할 수 있게 해줍니다[9, 11].

  • 프롬프트와 시드(Seed)를 활용한 환경 및 캐릭터 일관성 제어 특정 모델의 참조 기능 외에도, 프롬프트를 작성할 때 핵심적인 스타일과 조명 묘사 등의 언어를 여러 생성에 걸쳐 정확하게 똑같이 반복하면 출력물의 시각적 일관성을 높일 수 있습니다[7]. 또한 동일한 --seed 파라미터를 유지 적용하면 샷마다 일관된 프레이밍과 구도를 유지할 수 있으며, 연작 스토리보드나 에피소드 기반의 이미지 생성에서 피사체 및 아키텍처의 연속성을 확보하는 데 매우 유용합니다[6, 12, 13].

  • DALL-E 3의 캐릭터 일관성 한계와 우회 기법 미드저니와 달리 DALL-E 3는 생성한 캐릭터나 장면을 기억하여 그대로 재사용하는 기능이 없어 스토리텔링을 위한 일관된 다중 이미지 생성이 매우 어렵습니다[14]. 이를 극복하기 위해 사용자들은 하나의 큰 캔버스(장면) 안에 캐릭터를 여러 상황으로 분할하여 묘사하는 우회 기법을 사용합니다[14]. 예를 들어, 프롬프트 내에서 "왼쪽 위 코너", "오른쪽 위 코너"와 같이 위치를 지정하거나 "몽타주(montage)"라는 키워드를 사용하여 한 장의 이미지 안에 동일한 캐릭터의 다양한 모습을 담아낼 수 있습니다[14].

  • 비디오 생성 모델에서의 캐릭터 일관성 유지 구글의 Veo 3.1 비디오 생성 모델의 경우, "Ingredients to video" 기능을 통해 샷 간의 일관성을 유지합니다[5, 15]. Gemini 2.5 Flash Image 등을 활용하여 캐릭터와 배경에 대한 참조 이미지를 생성한 뒤 이를 제공하면, 여러 샷에 걸쳐 일관된 미학과 캐릭터가 유지되는 대화 장면 등의 비디오를 구성할 수 있습니다[5, 15].

🔗 Knowledge Connections

  • Related Topics: Prompt Parameters, Seed, Omni Reference, Style Reference
  • Projects/Contexts: Storytelling and Comic Book Generation, Brand Identity and Marketing Campaigns
  • Contradictions/Notes: 미드저니(V6/V7)나 Veo 3.1과 같은 모델들은 --cref, --oref 또는 "Ingredients to video" 기능을 통해 시스템적으로 연속적인 캐릭터 및 객체 생성을 강력하게 지원합니다[1, 9, 15]. 반면, DALL-E 3는 이러한 재사용 기능이 지원되지 않아 다수의 개별 이미지로 스토리를 구성하기보다는 단일 이미지 내에 몽타주 기법을 써야 하는 등 플랫폼 간 기능적 한계와 접근 방식에 명확한 차이가 존재합니다[14].

Last updated: 2026-04-30