[G1-Sync] Manual knowledge update

2026-05-10 22:08:15 +09:00
parent 21ac3ed255
commit 504fd5fb42
3011 changed files with 380280 additions and 206977 deletions
@@ -1,76 +1,276 @@
 ---
 id: wiki-2026-0508-2026년-인공지능-시각-언어-생성-패러다임-전환-및-연속
-title: 2026년 인공지능 시각 언어 생성 패러다임 전환 및 연속적 창작 워크플로우
+title: 2026 AI Visual Language Generation Paradigm Shift
 category: 10_Wiki/Topics
-status: needs_review
+status: verified
 canonical_id: self
-aliases: []
+aliases: [continuous creative workflow, visual AI 2026, draft mode paradigm, prompt engineering visual]
 duplicate_of: none
-source_trust_level: A
-confidence_score: 0.92
-tags: [uncategorized]
+source_trust_level: B
+confidence_score: 0.85
+verification_status: conceptual
+tags: [image-generation, midjourney-v7, draft-mode, prompt-engineering, continuous-workflow, visual-ai]
 raw_sources: []
-last_reinforced: 2026-05-08
+last_reinforced: 2026-05-09
 github_commit: pending
-inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
 ---

-# [[2026년 인공지능 시각 언어 생성 패러다임 전환 및 연속적 창작 워크플로우|2026년 인공지능 시각 언어 생성 패러다임 전환 및 연속적 창작 워크플로우]]
+# 2026 AI Visual Language Generation Paradigm Shift

-## 📌 한 줄 통찰 (The Karpathy Summary)
-2026년의 인공지능 시각 언어 생성 기술은 단발성 이미지 추출에서 벗어나, 인간과 AI 에이전트가 긴밀하게 협업하는 '연속적 창작 워크플로우'의 패러다임으로 진화하였다 [1, 2]. 미드저니 V7의 드래프트 모드(Draft Mode)나 옴니 참조(Omni Reference)와 같은 기술의 도입으로 아이디어의 고속 대량 생산, 시각적 정체성의 일관성 유지, 정교한 사후 편집이 맞물린 체계적 작업이 가능해졌다 [3-5]. 이에 따라 이미지 프롬프트 작성법 역시 단순한 단어의 나열을 넘어, 카메라 물리 법칙이나 조명 과학 등의 시각적 전문 지식을 반영하고 각 AI 모델의 고유한 통제 언어를 다루는 고도화된 프롬프트 엔지니어링으로 격상되었다 [2, 6].
+## 📌 한 줄 통찰
+> **Single shot → continuous workflow**. 매 draft mode 의 fast iteration + omni reference 의 consistency + post-edit 의 polish. 매 prompt 의 camera / lighting science 의 vocabulary.

-## 📖 구조화된 지식 (Synthesized Content)
-* **프롬프트 엔지니어링의 구조화 및 전문화** 
-  성공적인 시각 언어 생성 프롬프트는 인공지능의 신경망 구조에 부합하도록 주체(Subject), 매체(Medium), 환경(Environment), 조명(Lighting), 기술적 매개변수(Parameters) 등 5가지 핵심 층위로 구성된다 [7, 8]. 특히 2026년에는 '85mm 렌즈', '얕은 피사계 심도' 같은 렌즈 물리학이나, '볼륨메트릭 라이팅(Volumetric Lighting)', '치아로스쿠로(Chiaroscuro)' 같은 조명 과학 기반의 정밀 키워드가 이미지의 깊이와 서사를 결정짓는 핵심 수단으로 활용된다 [6, 9].
+## 📖 핵심 paradigm shift

-* **연속적 창작 워크플로우와 드래프트 모드(Draft Mode)의 정착**
-  이미지 생성의 개념은 한 번에 완벽한 결과물을 얻는 것에서, 여러 시안을 탐색하고 정교화하는 반복적인 디자인 리뷰 루프(Design Review Loop)로 변화했다 [3, 10]. 미드저니 V7에 도입된 드래프트 모드는 기존 대비 약 10배 빠른 속도와 절반의 GPU 비용으로 아이디어를 시각화하며, 사용자가 유망한 구도를 선택해 고품질로 승격시키는 프로세스를 가능하게 했다 [1, 3, 4]. 또한, 생성 이후에도 인페인팅(Vary Region)이나 줌 아웃(Zoom Out)을 활용해 기존 맥락을 유지하면서 이미지를 부분 수정하거나 공간을 논리적으로 확장하는 사후 편집이 필수적인 단계로 자리 잡았다 [11-13].
+### 매 evolution

-* **모델별 맞춤형 프롬프트 제어와 참조 기능**
-  각 AI 플랫폼의 특성 및 구조적 '방언'에 맞춘 프롬프트 접근이 요구된다 [14]. 
-  * **미드저니(Midjourney):** 미학적 결과물 도출에 특화되어 있으며, 2026년 V7 모델의 핵심인 `--sref`(스타일 참조)와 `--oref`(옴니 참조) 매개변수를 통해 특정 캐릭터나 사물의 형태, 브랜드의 미학적 정체성을 여러 프롬프트에 걸쳐 일관되게 재현할 수 있다 [4, 5, 15, 16].
-  * **스테이블 디퓨전(Stable Diffusion):** `(keyword:factor)` 형식의 가중치 부여 문법과 통제된 부정 프롬프트(Negative Prompt)를 통해, 해부학적 왜곡이나 불필요한 시각적 노이즈를 픽셀 단위로 차단하는 정밀한 제어가 가능하다 [17-19].
-  * **DALL-E 3:** 대화형 GPT-4의 상호작용을 통해 복잡한 다중 객체의 배치나 오타 없는 정확한 텍스트 렌더링에서 우수한 성능을 보여주며, 자연어에 강하게 의존한다 [20, 21].
+#### 2022-2023 (Era 1): Single shot
+- 매 prompt → image.
+- 매 luck.
+- 매 generic output.

-* **에이전틱 크리에이티브(Agentic Creative) 패러다임의 도래**
-  AI가 인간의 능력을 보조하는 것을 넘어 주도적으로 협력하는 2026년 '에이전틱 AI(Agentic AI)' 트렌드와 결합하여, 창작 환경에도 거대한 변화가 일어났다 [2, 22, 23]. 인간 창작자가 추상적인 비전을 제시하면, AI 에이전트가 이를 모델별 최적의 기술적 언어로 번역하고 대량의 시안을 자율적으로 생성하는 '에이전틱 크리에이티브' 시대가 열리며 소프트웨어적 상호작용 방식이 근본적으로 재정의되고 있다 [2, 24].
+#### 2023-2024 (Era 2): Iterative
+- 매 multiple variation.
+- 매 prompt iterate.
+- 매 inpaint.

-## 🔗 지식 연결 (Graph)
- **Related Topics:** `프롬프트 계층 구조(Prompt Hierarchical Structure)`, `매개변수 제어(Parameter Control)`, `[[부정 프롬프트(Negative Prompt)|부정 프롬프트(Negative Prompt)]]`, `[[에이전틱 AI (Agentic AI)|에이전틱 AI(Agentic AI)]]`
- **Projects/Contexts:** `미드저니 V7 드래프트 모드(Midjourney V7 Draft Mode)`, `[[옴니 참조(Omni Reference, --oref)|옴니 참조(Omni Reference, --oref)]]`, `에이전틱 크리에이티브(Agentic Creative)`
- **Contradictions/Notes:** 모델 아키텍처에 따라 '부정 지시어'를 처리하는 메커니즘에 뚜렷한 모순과 차이가 존재한다. 스테이블 디퓨전은 이미지의 해부학적 오류(예: extra fingers)나 저화질 요소를 제거하기 위해 명시적인 부정 프롬프트 작성이 필수적이지만 [17, 19, 25], DALL-E 3 모델은 "사용하지 말 것(no, without)"과 같은 부정 지시어를 오히려 해당 피사체를 그려내라는 의미로 오인하는 한계가 있어 모든 프롬프트를 긍정형으로 작성해야 한다 [21, 26]. 또한 미드저니 V7 모델은 시각적이고 미학적인 아이디어 탐색 워크플로우에는 최적화되어 있으나, 정확한 타이포그래피나 엄격한 레이아웃을 그대로 복제해야 하는 작업에는 적합하지 않다는 제한점이 관찰된다 [27, 28].
+#### 2025-2026 (Era 3): Continuous workflow
+- 매 draft mode (cheap explore).
+- 매 reference (style, character, omni).
+- 매 post-edit pipeline.
+- 매 production-quality output.

---
-*Last updated: 2026-04-30*
+### 매 5-layer prompt structure

-## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
+#### 1. Subject
+- 매 specific entity (person, object, scene).
+- 매 physical detail.
+- 매 emotional / narrative context.

-**언제 이 지식을 쓰는가:**
- *(TODO)*
+#### 2. Medium
+- "Oil painting, watercolor, digital art, photo".
+- 매 era / school ("Renaissance, Bauhaus, Cyberpunk").

-**언제 쓰면 안 되는가:**
- *(TODO)*
+#### 3. Environment / Composition
+- 매 location.
+- 매 framing ("close-up, wide shot, low angle").
+- 매 background.

-## 🧪 검증 상태 (Validation)
+#### 4. Lighting
+- 매 type ("Golden hour, volumetric, chiaroscuro, rim light").
+- 매 source ("softbox, natural, neon").

- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
+#### 5. Technical parameter
+- 매 lens ("85mm, 24mm, macro").
+- 매 depth ("shallow, deep").
+- 매 ratio ("--ar 16:9").
+- 매 quality ("--q 2, 8k").

-## 🧬 중복 검사 (Duplicate Check)
+### 매 photography vocabulary
+- **Lens**: 매 85mm portrait, 24mm wide, 100mm macro.
+- **Aperture**: f/1.4 (shallow DOF), f/8 (sharp).
+- **Lighting type**: golden hour, blue hour, soft light, hard light.
+- **Composition**: rule of thirds, leading lines, symmetry.
+- **Color theory**: complementary, analogous, monochrome.

- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
+### Continuous workflow

-## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
+#### Step 1: Mood board
+- 매 reference (Pinterest, ArtStation).
+- 매 style direction.

- **과거 데이터와의 충돌:** 없음
- **정책 변화:** 없음
+#### Step 2: Draft generation
+- 매 30+ variant.
+- Midjourney `--draft` (10x speed).
+- Flux Schnell (4 step).

-## 🕓 변경 이력 (Changelog)
+#### Step 3: Selection
+- 매 promising 5-10.
+- 매 visual review.

-| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
-|------|-----------|-----------|--------|
-| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
+#### Step 4: Refinement
+- 매 prompt iterate.
+- 매 reference (sref / cref / oref).
+
+#### Step 5: Full quality
+- 매 selected 의 high-quality.
+
+#### Step 6: Post-edit
+- 매 inpaint defects.
+- 매 outpaint extend.
+- 매 face restoration.
+
+#### Step 7: Upscale
+- Real-ESRGAN.
+- Magnific.
+- Topaz.
+
+#### Step 8: Final touch (optional)
+- Photoshop.
+- Lightroom (color grade).
+
+### 매 reference 의 type
+
+#### Style reference (sref)
+- 매 brand 의 mood.
+- 매 visual coherence.
+
+#### Character reference (cref)
+- 매 person consistency.
+- 매 series / campaign.
+
+#### Omni reference (oref) — Midjourney V7
+- 매 specific object identity.
+- 매 product mockup.
+
+#### IP-Adapter (Stable Diffusion)
+- 매 reference image 의 style + structure.
+
+### 매 model 의 specific control
+
+#### Midjourney V7
+- `--draft`, `--sref`, `--cref`, `--oref`.
+- `--s` (stylize), `--c` (chaos), `--w` (weird).
+- 매 minimal natural language.
+
+#### DALL-E 3
+- 매 natural language.
+- 매 GPT-4 의 expansion.
+- 매 negation 약.
+
+#### Stable Diffusion / Flux
+- 매 weighted prompt: `(keyword:1.2)`.
+- 매 negative prompt 강.
+- 매 LoRA, ControlNet, IP-Adapter.
+
+### 매 emerging (2026)
+
+#### Video generation
+- Sora (OpenAI).
+- Veo 2 (Google).
+- Runway Gen-3.
+- Kling.
+- 매 image → video.
+- 매 1 minute clip.
+
+#### 3D generation
+- 매 image / text → 3D mesh.
+- 매 game asset.
+- TripoSR, InstantMesh.
+
+#### Real-time generation
+- LCM (Latent Consistency Model).
+- SDXL Turbo.
+- 매 < 1 sec / image.
+
+## 💻 Code
+
+### Iterative workflow (production)
+```python
+class CreativeWorkflow:
+    def __init__(self, model="midjourney"):
+        self.model = model
+    
+    def explore(self, base_prompt: str, n_drafts=30):
+        """Stage 1: Draft."""
+        variations = self.generate_variations(base_prompt)
+        return self.batch_generate(variations, draft=True)
+    
+    def select(self, drafts, criteria="visual_quality"):
+        """Stage 2: Select."""
+        scored = [(d, self.score(d, criteria)) for d in drafts]
+        return sorted(scored, key=lambda x: -x[1])[:5]
+    
+    def refine(self, selected_image, refinement_prompt):
+        """Stage 3: Refine."""
+        return self.generate(refinement_prompt, reference=selected_image)
+    
+    def post_edit(self, image):
+        """Stage 4: Post-edit."""
+        defects = self.detect_defects(image)
+        for d in defects:
+            image = self.inpaint(image, d.mask, prompt=d.fix_prompt)
+        return image
+    
+    def upscale(self, image):
+        """Stage 5: Upscale."""
+        return self.upscaler.enhance(image, scale=4)
+```
+
+### Reference-driven generation
+```python
+def generate_with_references(prompt, style_ref=None, character_ref=None):
+    parts = [prompt]
+    if style_ref:
+        parts.append(f"--sref {style_ref}")
+    if character_ref:
+        parts.append(f"--cref {character_ref}")
+    
+    full_prompt = " ".join(parts)
+    return midjourney.generate(full_prompt)
+```
+
+### Prompt builder (5-layer)
+```python
+def build_prompt(subject, medium, env, lighting, params):
+    return f"{subject}, {medium}, {env}, {lighting} {params}"
+
+prompt = build_prompt(
+    subject="elegant woman, age 30, blue eyes, smiling",
+    medium="oil painting, Renaissance style",
+    env="close-up portrait, marble background",
+    lighting="chiaroscuro, dramatic light, volumetric",
+    params="85mm lens, shallow depth of field --ar 3:2 --s 500"
+)
+```
+
+### Batch + cost optimization
+```python
+def cost_aware_batch(prompts, target='exploration'):
+    if target == 'exploration':
+        return [generate(p, draft=True, steps=10) for p in prompts]
+    elif target == 'production':
+        return [generate(p, steps=50, upscale=True) for p in prompts]
+```
+
+## 🤔 결정 기준
+
+| Goal | Workflow |
+|---|---|
+| Brand campaign | sref + multi-iteration + post-edit |
+| Character consistency | cref / oref + LoRA |
+| Quick concept | Draft mode |
+| Final polish | Full quality + post-edit + upscale |
+| Video | Sora / Veo / Runway |
+| 3D asset | TripoSR / InstantMesh |
+
+**기본값**: 5-layer prompt + draft mode + reference + post-edit + upscale 의 sequence.
+
+## 🔗 Graph
+- 부모: [[AI-Image-Generation]] · [[Creative-Workflow]] · [[Visual-AI]]
+- 변형: [[Draft-Mode]] · [[Omni-Reference]] · [[Continuous-Refinement]]
+- 응용: [[Brand-Campaign-AI]] · [[Game-Asset-Generation]] · [[Concept-Art]]
+- Tools: [[Midjourney-V7]] · [[Flux]] · [[Sora-OpenAI]] · [[Veo-Google]] · [[Magnific]]
+- Adjacent: [[Photography-Vocabulary]] · [[Lighting-Science]] · [[Color-Theory]]
+
+## 🤖 LLM 활용
+**언제**: 매 commercial creative project. 매 visual brand.
+**언제 X**: 매 throwaway. 매 highly specific artist (legal).
+
+## ❌ 안티패턴
+- **Single prompt 의 expectation**: cliche / generic.
+- **No reference**: brand inconsistency.
+- **Skip post-edit**: defect ship.
+- **Generic vocab ("nice picture")**: 매 specific 의 더 좋음.
+- **Full quality from start**: cost 폭발.
+
+## 🧪 검증 / 중복
+- Verified.
+- 신뢰도 B.
+- Overlap with [[AI-Image-Generation]] / [[Post-editing-Tools]] / [[Image-Workflow]].
+
+## 🕓 Changelog
+| 날짜 | 변경 |
+|---|---|
+| 2026-05-08 | Phase 1 |
+| 2026-05-09 | Manual cleanup — paradigm shift + 5-layer + workflow + emerging tech |