[G1-Sync] Manual knowledge update
This commit is contained in:
@@ -1,76 +1,276 @@
|
||||
---
|
||||
id: wiki-2026-0508-2026년-인공지능-시각-언어-생성-패러다임-전환-및-연속
|
||||
title: 2026년 인공지능 시각 언어 생성 패러다임 전환 및 연속적 창작 워크플로우
|
||||
title: 2026 AI Visual Language Generation Paradigm Shift
|
||||
category: 10_Wiki/Topics
|
||||
status: needs_review
|
||||
status: verified
|
||||
canonical_id: self
|
||||
aliases: []
|
||||
aliases: [continuous creative workflow, visual AI 2026, draft mode paradigm, prompt engineering visual]
|
||||
duplicate_of: none
|
||||
source_trust_level: A
|
||||
confidence_score: 0.92
|
||||
tags: [uncategorized]
|
||||
source_trust_level: B
|
||||
confidence_score: 0.85
|
||||
verification_status: conceptual
|
||||
tags: [image-generation, midjourney-v7, draft-mode, prompt-engineering, continuous-workflow, visual-ai]
|
||||
raw_sources: []
|
||||
last_reinforced: 2026-05-08
|
||||
last_reinforced: 2026-05-09
|
||||
github_commit: pending
|
||||
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
|
||||
---
|
||||
|
||||
# [[2026년 인공지능 시각 언어 생성 패러다임 전환 및 연속적 창작 워크플로우|2026년 인공지능 시각 언어 생성 패러다임 전환 및 연속적 창작 워크플로우]]
|
||||
# 2026 AI Visual Language Generation Paradigm Shift
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
2026년의 인공지능 시각 언어 생성 기술은 단발성 이미지 추출에서 벗어나, 인간과 AI 에이전트가 긴밀하게 협업하는 '연속적 창작 워크플로우'의 패러다임으로 진화하였다 [1, 2]. 미드저니 V7의 드래프트 모드(Draft Mode)나 옴니 참조(Omni Reference)와 같은 기술의 도입으로 아이디어의 고속 대량 생산, 시각적 정체성의 일관성 유지, 정교한 사후 편집이 맞물린 체계적 작업이 가능해졌다 [3-5]. 이에 따라 이미지 프롬프트 작성법 역시 단순한 단어의 나열을 넘어, 카메라 물리 법칙이나 조명 과학 등의 시각적 전문 지식을 반영하고 각 AI 모델의 고유한 통제 언어를 다루는 고도화된 프롬프트 엔지니어링으로 격상되었다 [2, 6].
|
||||
## 📌 한 줄 통찰
|
||||
> **Single shot → continuous workflow**. 매 draft mode 의 fast iteration + omni reference 의 consistency + post-edit 의 polish. 매 prompt 의 camera / lighting science 의 vocabulary.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
* **프롬프트 엔지니어링의 구조화 및 전문화**
|
||||
성공적인 시각 언어 생성 프롬프트는 인공지능의 신경망 구조에 부합하도록 주체(Subject), 매체(Medium), 환경(Environment), 조명(Lighting), 기술적 매개변수(Parameters) 등 5가지 핵심 층위로 구성된다 [7, 8]. 특히 2026년에는 '85mm 렌즈', '얕은 피사계 심도' 같은 렌즈 물리학이나, '볼륨메트릭 라이팅(Volumetric Lighting)', '치아로스쿠로(Chiaroscuro)' 같은 조명 과학 기반의 정밀 키워드가 이미지의 깊이와 서사를 결정짓는 핵심 수단으로 활용된다 [6, 9].
|
||||
## 📖 핵심 paradigm shift
|
||||
|
||||
* **연속적 창작 워크플로우와 드래프트 모드(Draft Mode)의 정착**
|
||||
이미지 생성의 개념은 한 번에 완벽한 결과물을 얻는 것에서, 여러 시안을 탐색하고 정교화하는 반복적인 디자인 리뷰 루프(Design Review Loop)로 변화했다 [3, 10]. 미드저니 V7에 도입된 드래프트 모드는 기존 대비 약 10배 빠른 속도와 절반의 GPU 비용으로 아이디어를 시각화하며, 사용자가 유망한 구도를 선택해 고품질로 승격시키는 프로세스를 가능하게 했다 [1, 3, 4]. 또한, 생성 이후에도 인페인팅(Vary Region)이나 줌 아웃(Zoom Out)을 활용해 기존 맥락을 유지하면서 이미지를 부분 수정하거나 공간을 논리적으로 확장하는 사후 편집이 필수적인 단계로 자리 잡았다 [11-13].
|
||||
### 매 evolution
|
||||
|
||||
* **모델별 맞춤형 프롬프트 제어와 참조 기능**
|
||||
각 AI 플랫폼의 특성 및 구조적 '방언'에 맞춘 프롬프트 접근이 요구된다 [14].
|
||||
* **미드저니(Midjourney):** 미학적 결과물 도출에 특화되어 있으며, 2026년 V7 모델의 핵심인 `--sref`(스타일 참조)와 `--oref`(옴니 참조) 매개변수를 통해 특정 캐릭터나 사물의 형태, 브랜드의 미학적 정체성을 여러 프롬프트에 걸쳐 일관되게 재현할 수 있다 [4, 5, 15, 16].
|
||||
* **스테이블 디퓨전(Stable Diffusion):** `(keyword:factor)` 형식의 가중치 부여 문법과 통제된 부정 프롬프트(Negative Prompt)를 통해, 해부학적 왜곡이나 불필요한 시각적 노이즈를 픽셀 단위로 차단하는 정밀한 제어가 가능하다 [17-19].
|
||||
* **DALL-E 3:** 대화형 GPT-4의 상호작용을 통해 복잡한 다중 객체의 배치나 오타 없는 정확한 텍스트 렌더링에서 우수한 성능을 보여주며, 자연어에 강하게 의존한다 [20, 21].
|
||||
#### 2022-2023 (Era 1): Single shot
|
||||
- 매 prompt → image.
|
||||
- 매 luck.
|
||||
- 매 generic output.
|
||||
|
||||
* **에이전틱 크리에이티브(Agentic Creative) 패러다임의 도래**
|
||||
AI가 인간의 능력을 보조하는 것을 넘어 주도적으로 협력하는 2026년 '에이전틱 AI(Agentic AI)' 트렌드와 결합하여, 창작 환경에도 거대한 변화가 일어났다 [2, 22, 23]. 인간 창작자가 추상적인 비전을 제시하면, AI 에이전트가 이를 모델별 최적의 기술적 언어로 번역하고 대량의 시안을 자율적으로 생성하는 '에이전틱 크리에이티브' 시대가 열리며 소프트웨어적 상호작용 방식이 근본적으로 재정의되고 있다 [2, 24].
|
||||
#### 2023-2024 (Era 2): Iterative
|
||||
- 매 multiple variation.
|
||||
- 매 prompt iterate.
|
||||
- 매 inpaint.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- **Related Topics:** `프롬프트 계층 구조(Prompt Hierarchical Structure)`, `매개변수 제어(Parameter Control)`, `[[부정 프롬프트(Negative Prompt)|부정 프롬프트(Negative Prompt)]]`, `[[에이전틱 AI (Agentic AI)|에이전틱 AI(Agentic AI)]]`
|
||||
- **Projects/Contexts:** `미드저니 V7 드래프트 모드(Midjourney V7 Draft Mode)`, `[[옴니 참조(Omni Reference, --oref)|옴니 참조(Omni Reference, --oref)]]`, `에이전틱 크리에이티브(Agentic Creative)`
|
||||
- **Contradictions/Notes:** 모델 아키텍처에 따라 '부정 지시어'를 처리하는 메커니즘에 뚜렷한 모순과 차이가 존재한다. 스테이블 디퓨전은 이미지의 해부학적 오류(예: extra fingers)나 저화질 요소를 제거하기 위해 명시적인 부정 프롬프트 작성이 필수적이지만 [17, 19, 25], DALL-E 3 모델은 "사용하지 말 것(no, without)"과 같은 부정 지시어를 오히려 해당 피사체를 그려내라는 의미로 오인하는 한계가 있어 모든 프롬프트를 긍정형으로 작성해야 한다 [21, 26]. 또한 미드저니 V7 모델은 시각적이고 미학적인 아이디어 탐색 워크플로우에는 최적화되어 있으나, 정확한 타이포그래피나 엄격한 레이아웃을 그대로 복제해야 하는 작업에는 적합하지 않다는 제한점이 관찰된다 [27, 28].
|
||||
#### 2025-2026 (Era 3): Continuous workflow
|
||||
- 매 draft mode (cheap explore).
|
||||
- 매 reference (style, character, omni).
|
||||
- 매 post-edit pipeline.
|
||||
- 매 production-quality output.
|
||||
|
||||
---
|
||||
*Last updated: 2026-04-30*
|
||||
### 매 5-layer prompt structure
|
||||
|
||||
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
|
||||
#### 1. Subject
|
||||
- 매 specific entity (person, object, scene).
|
||||
- 매 physical detail.
|
||||
- 매 emotional / narrative context.
|
||||
|
||||
**언제 이 지식을 쓰는가:**
|
||||
- *(TODO)*
|
||||
#### 2. Medium
|
||||
- "Oil painting, watercolor, digital art, photo".
|
||||
- 매 era / school ("Renaissance, Bauhaus, Cyberpunk").
|
||||
|
||||
**언제 쓰면 안 되는가:**
|
||||
- *(TODO)*
|
||||
#### 3. Environment / Composition
|
||||
- 매 location.
|
||||
- 매 framing ("close-up, wide shot, low angle").
|
||||
- 매 background.
|
||||
|
||||
## 🧪 검증 상태 (Validation)
|
||||
#### 4. Lighting
|
||||
- 매 type ("Golden hour, volumetric, chiaroscuro, rim light").
|
||||
- 매 source ("softbox, natural, neon").
|
||||
|
||||
- **정보 상태:** needs_review
|
||||
- **출처 신뢰도:** A
|
||||
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
|
||||
#### 5. Technical parameter
|
||||
- 매 lens ("85mm, 24mm, macro").
|
||||
- 매 depth ("shallow, deep").
|
||||
- 매 ratio ("--ar 16:9").
|
||||
- 매 quality ("--q 2, 8k").
|
||||
|
||||
## 🧬 중복 검사 (Duplicate Check)
|
||||
### 매 photography vocabulary
|
||||
- **Lens**: 매 85mm portrait, 24mm wide, 100mm macro.
|
||||
- **Aperture**: f/1.4 (shallow DOF), f/8 (sharp).
|
||||
- **Lighting type**: golden hour, blue hour, soft light, hard light.
|
||||
- **Composition**: rule of thirds, leading lines, symmetry.
|
||||
- **Color theory**: complementary, analogous, monochrome.
|
||||
|
||||
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
|
||||
- **처리 방식:** UPDATE (자동 정규화)
|
||||
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
|
||||
### Continuous workflow
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
|
||||
#### Step 1: Mood board
|
||||
- 매 reference (Pinterest, ArtStation).
|
||||
- 매 style direction.
|
||||
|
||||
- **과거 데이터와의 충돌:** 없음
|
||||
- **정책 변화:** 없음
|
||||
#### Step 2: Draft generation
|
||||
- 매 30+ variant.
|
||||
- Midjourney `--draft` (10x speed).
|
||||
- Flux Schnell (4 step).
|
||||
|
||||
## 🕓 변경 이력 (Changelog)
|
||||
#### Step 3: Selection
|
||||
- 매 promising 5-10.
|
||||
- 매 visual review.
|
||||
|
||||
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|
||||
|------|-----------|-----------|--------|
|
||||
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
|
||||
#### Step 4: Refinement
|
||||
- 매 prompt iterate.
|
||||
- 매 reference (sref / cref / oref).
|
||||
|
||||
#### Step 5: Full quality
|
||||
- 매 selected 의 high-quality.
|
||||
|
||||
#### Step 6: Post-edit
|
||||
- 매 inpaint defects.
|
||||
- 매 outpaint extend.
|
||||
- 매 face restoration.
|
||||
|
||||
#### Step 7: Upscale
|
||||
- Real-ESRGAN.
|
||||
- Magnific.
|
||||
- Topaz.
|
||||
|
||||
#### Step 8: Final touch (optional)
|
||||
- Photoshop.
|
||||
- Lightroom (color grade).
|
||||
|
||||
### 매 reference 의 type
|
||||
|
||||
#### Style reference (sref)
|
||||
- 매 brand 의 mood.
|
||||
- 매 visual coherence.
|
||||
|
||||
#### Character reference (cref)
|
||||
- 매 person consistency.
|
||||
- 매 series / campaign.
|
||||
|
||||
#### Omni reference (oref) — Midjourney V7
|
||||
- 매 specific object identity.
|
||||
- 매 product mockup.
|
||||
|
||||
#### IP-Adapter (Stable Diffusion)
|
||||
- 매 reference image 의 style + structure.
|
||||
|
||||
### 매 model 의 specific control
|
||||
|
||||
#### Midjourney V7
|
||||
- `--draft`, `--sref`, `--cref`, `--oref`.
|
||||
- `--s` (stylize), `--c` (chaos), `--w` (weird).
|
||||
- 매 minimal natural language.
|
||||
|
||||
#### DALL-E 3
|
||||
- 매 natural language.
|
||||
- 매 GPT-4 의 expansion.
|
||||
- 매 negation 약.
|
||||
|
||||
#### Stable Diffusion / Flux
|
||||
- 매 weighted prompt: `(keyword:1.2)`.
|
||||
- 매 negative prompt 강.
|
||||
- 매 LoRA, ControlNet, IP-Adapter.
|
||||
|
||||
### 매 emerging (2026)
|
||||
|
||||
#### Video generation
|
||||
- Sora (OpenAI).
|
||||
- Veo 2 (Google).
|
||||
- Runway Gen-3.
|
||||
- Kling.
|
||||
- 매 image → video.
|
||||
- 매 1 minute clip.
|
||||
|
||||
#### 3D generation
|
||||
- 매 image / text → 3D mesh.
|
||||
- 매 game asset.
|
||||
- TripoSR, InstantMesh.
|
||||
|
||||
#### Real-time generation
|
||||
- LCM (Latent Consistency Model).
|
||||
- SDXL Turbo.
|
||||
- 매 < 1 sec / image.
|
||||
|
||||
## 💻 Code
|
||||
|
||||
### Iterative workflow (production)
|
||||
```python
|
||||
class CreativeWorkflow:
|
||||
def __init__(self, model="midjourney"):
|
||||
self.model = model
|
||||
|
||||
def explore(self, base_prompt: str, n_drafts=30):
|
||||
"""Stage 1: Draft."""
|
||||
variations = self.generate_variations(base_prompt)
|
||||
return self.batch_generate(variations, draft=True)
|
||||
|
||||
def select(self, drafts, criteria="visual_quality"):
|
||||
"""Stage 2: Select."""
|
||||
scored = [(d, self.score(d, criteria)) for d in drafts]
|
||||
return sorted(scored, key=lambda x: -x[1])[:5]
|
||||
|
||||
def refine(self, selected_image, refinement_prompt):
|
||||
"""Stage 3: Refine."""
|
||||
return self.generate(refinement_prompt, reference=selected_image)
|
||||
|
||||
def post_edit(self, image):
|
||||
"""Stage 4: Post-edit."""
|
||||
defects = self.detect_defects(image)
|
||||
for d in defects:
|
||||
image = self.inpaint(image, d.mask, prompt=d.fix_prompt)
|
||||
return image
|
||||
|
||||
def upscale(self, image):
|
||||
"""Stage 5: Upscale."""
|
||||
return self.upscaler.enhance(image, scale=4)
|
||||
```
|
||||
|
||||
### Reference-driven generation
|
||||
```python
|
||||
def generate_with_references(prompt, style_ref=None, character_ref=None):
|
||||
parts = [prompt]
|
||||
if style_ref:
|
||||
parts.append(f"--sref {style_ref}")
|
||||
if character_ref:
|
||||
parts.append(f"--cref {character_ref}")
|
||||
|
||||
full_prompt = " ".join(parts)
|
||||
return midjourney.generate(full_prompt)
|
||||
```
|
||||
|
||||
### Prompt builder (5-layer)
|
||||
```python
|
||||
def build_prompt(subject, medium, env, lighting, params):
|
||||
return f"{subject}, {medium}, {env}, {lighting} {params}"
|
||||
|
||||
prompt = build_prompt(
|
||||
subject="elegant woman, age 30, blue eyes, smiling",
|
||||
medium="oil painting, Renaissance style",
|
||||
env="close-up portrait, marble background",
|
||||
lighting="chiaroscuro, dramatic light, volumetric",
|
||||
params="85mm lens, shallow depth of field --ar 3:2 --s 500"
|
||||
)
|
||||
```
|
||||
|
||||
### Batch + cost optimization
|
||||
```python
|
||||
def cost_aware_batch(prompts, target='exploration'):
|
||||
if target == 'exploration':
|
||||
return [generate(p, draft=True, steps=10) for p in prompts]
|
||||
elif target == 'production':
|
||||
return [generate(p, steps=50, upscale=True) for p in prompts]
|
||||
```
|
||||
|
||||
## 🤔 결정 기준
|
||||
|
||||
| Goal | Workflow |
|
||||
|---|---|
|
||||
| Brand campaign | sref + multi-iteration + post-edit |
|
||||
| Character consistency | cref / oref + LoRA |
|
||||
| Quick concept | Draft mode |
|
||||
| Final polish | Full quality + post-edit + upscale |
|
||||
| Video | Sora / Veo / Runway |
|
||||
| 3D asset | TripoSR / InstantMesh |
|
||||
|
||||
**기본값**: 5-layer prompt + draft mode + reference + post-edit + upscale 의 sequence.
|
||||
|
||||
## 🔗 Graph
|
||||
- 부모: [[AI-Image-Generation]] · [[Creative-Workflow]] · [[Visual-AI]]
|
||||
- 변형: [[Draft-Mode]] · [[Omni-Reference]] · [[Continuous-Refinement]]
|
||||
- 응용: [[Brand-Campaign-AI]] · [[Game-Asset-Generation]] · [[Concept-Art]]
|
||||
- Tools: [[Midjourney-V7]] · [[Flux]] · [[Sora-OpenAI]] · [[Veo-Google]] · [[Magnific]]
|
||||
- Adjacent: [[Photography-Vocabulary]] · [[Lighting-Science]] · [[Color-Theory]]
|
||||
|
||||
## 🤖 LLM 활용
|
||||
**언제**: 매 commercial creative project. 매 visual brand.
|
||||
**언제 X**: 매 throwaway. 매 highly specific artist (legal).
|
||||
|
||||
## ❌ 안티패턴
|
||||
- **Single prompt 의 expectation**: cliche / generic.
|
||||
- **No reference**: brand inconsistency.
|
||||
- **Skip post-edit**: defect ship.
|
||||
- **Generic vocab ("nice picture")**: 매 specific 의 더 좋음.
|
||||
- **Full quality from start**: cost 폭발.
|
||||
|
||||
## 🧪 검증 / 중복
|
||||
- Verified.
|
||||
- 신뢰도 B.
|
||||
- Overlap with [[AI-Image-Generation]] / [[Post-editing-Tools]] / [[Image-Workflow]].
|
||||
|
||||
## 🕓 Changelog
|
||||
| 날짜 | 변경 |
|
||||
|---|---|
|
||||
| 2026-05-08 | Phase 1 |
|
||||
| 2026-05-09 | Manual cleanup — paradigm shift + 5-layer + workflow + emerging tech |
|
||||
|
||||
Reference in New Issue
Block a user