Files
2nd/10_Wiki/Topics/프롬프트 확장(Prompt Expansion).md
T

3.6 KiB

프롬프트 확장(Prompt Expansion)

📌 Brief Summary

프롬프트 확장(Prompt Expansion)은 사용자가 입력한 짧고 단순한 지시어를 AI가 풍부한 시각적 묘사가 포함된 상세한 문장으로 자동 변환하거나 세부 요소를 덧붙이는 과정입니다 [1, 2]. 주로 DALL-E 3처럼 대규모 언어 모델(LLM)과 긴밀하게 통합된 이미지 생성 플랫폼에서 두드러지게 활용됩니다 [3]. 이를 통해 사용자는 구체적인 묘사 없이도 창의적이고 완성도 높은 이미지를 얻을 수 있으나, 정밀한 제어가 필요한 경우 의도적으로 이러한 확장을 차단하기도 합니다 [4, 5].

📖 Core Content

  • LLM 기반의 자동 확장 메커니즘 DALL-E 3는 ChatGPT의 언어 모델과 네이티브로 통합되어 있어 자연어에 대한 의존성이 매우 높습니다 [2, 3]. 사용자가 "미래형 AI 로봇을 생성해 줘"와 같이 매우 단순한 프롬프트를 입력하더라도, 언어 모델이 개입하여 로봇의 기계적 특징, 매끄러운 금속 표면, 관절의 형태, 구도 및 미니멀리즘적 배경 등을 세밀하게 묘사하는 단락 길이로 초기 프롬프트를 자동 증강(augment) 및 확장(expansion)합니다 [1, 2]. 텍스트가 매우 짧을 경우 GPT 모델은 결과물을 더 흥미롭게 만들기 위해 확장을 시도하며, 이는 결과물의 예술적 품질을 높이는 데 기여합니다 [4, 5].

  • 사용자 주도의 구조적 확장 소프트웨어가 자동으로 수행하는 확장 외에도, 사용자가 직접 프롬프트를 작성할 때 점진적으로 확장을 진행하는 구조가 권장됩니다. 먼저 명확한 중심 테마(Core Idea)를 설정한 후, 피사체, 배경(설정), 분위기 등의 세부 사항(Details) 레이어를 덧붙여 아이디어를 확장해 나갈 수 있습니다 [6]. 여기에 조명, 원근감, 예술적 스타일을 정의하는 요소를 추가하며 프롬프트를 점진적으로 심화하는 방식입니다 [6].

  • 프롬프트 확장의 한계와 제어 기법 언어 모델을 통한 자동 확장은 창의성을 모델에 일임할 때 훌륭한 기능이지만, 사용자 측면에서는 통제력을 잃게 만드는 원인이 될 수 있습니다 [4, 5]. 언어 모델이 프롬프트를 꾸미는 과정에서 의도치 않은 요소를 삽입하거나, 간결한 묘사를 선호하는 이미지 생성기의 특징과 충돌할 수 있기 때문입니다 [5]. 이러한 왜곡을 막고 제어력을 극대화하려면 프롬프트 내에 "입력한 프롬프트를 변경하지 말고 그대로 사용할 것(Use the prompt unchanged as entered)"이라는 명시적 지시를 포함하여 확장을 방지해야 합니다 [2, 4, 5]. 비영어권 언어로 입력할 때는 "프롬프트를 변경 없이 영어로만 번역할 것"이라고 지시하는 것이 좋습니다 [4, 5].

🔗 Knowledge Connections


Last updated: 2026-04-30