Files

T

Antigravity Agent c8e983afe7 chore: update graph view scale and set workspace default tab to graph view

2026-05-08 01:33:26 +09:00

5.0 KiB

Raw Blame History

id, title, category, status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, tags, raw_sources, last_reinforced, github_commit

title

디퓨전_모델_작동_원리

📌 한 줄 통찰 (The Karpathy Summary)

디퓨전 모델은 데이터에 노이즈를 섞는 과정을 학습한 뒤, 무작위 노이즈로부터 텍스트 조건에 맞춰 형태를 복원해가는 '역방향 확산'을 통해 고품질 이미지를 생성하는 아키텍처다.

📖 구조화된 지식 (Synthesized Content)

추출된 패턴:

생성은 파괴(노이즈 추가)의 역과정이며, 이 반복적인 디노이징(Denoising) 단계 덕분에 GAN보다 학습이 안정적이고 프롬프트를 통한 세밀한 제어가 가능하다.

세부 내용:

핵심 프로세스:
- 정방향 확산 (Forward Diffusion): 원본 데이터에 가우시안 노이즈를 점진적으로 추가하여 완전한 노이즈로 변환하는 과정을 학습.
- 역방향 확산 (Reverse Diffusion): 무작위 노이즈에서 시작하여 학습된 데이터를 바탕으로 노이즈를 제거하며 의도한 형태를 복원.
주요 특징:
- 안정성: GAN(생성적 적대 신경망)에 비해 훈련 과정이 안정적이고 모드 붕괴(Mode Collapse) 위험이 적음.
- 세밀한 제어: 반복적인 생성 단계 덕분에 사용자가 중간 단계에서 개입하거나 매개변수(CFG, Seed 등)로 결과물을 조율하기 용이함.
제약 사항: 반복 연산으로 인해 컴퓨팅 리소스 소모가 크며, 생성 속도가 단판 승부 방식인 GAN보다 상대적으로 느림.
플랫폼별 적용:
- Midjourney/DALL-E: 클라우드 기반, 뛰어난 예술적 해석력과 접근성.
- Stable Diffusion: 오픈소스, 로컬 제어 및 무한한 커스텀 가능성 제공.

🤖 LLM 활용 힌트 (How to Use This Knowledge)

언제 이 지식을 쓰는가:

이미지 생성 AI의 기술적 배경이나 작동 원리를 설명해야 할 때.
생성 속도, 품질, 제어 가능성 사이의 트레이드오프를 분석할 때.
미드저니의 --stop이나 스테이블 디퓨전의 Sampling Steps가 결과에 미치는 영향을 이해하고 싶을 때.

언제 이 지식을 쓰면 안 되는가:

GAN이나 VAE 등 확산 방식이 아닌 다른 생성 모델의 구체적 기술 사양이 필요한 경우.

이 지식을 적용할 때의 권장 절차:

개념 이해: 생성이 '노이즈에서 조각을 깎는 과정'임을 인식.
파라미터 조절: 디노이징 단계(Steps)를 높여 디테일을 확보하거나, CFG를 통해 프롬프트 준수 강도를 조절.
플랫폼 선택: 보안과 제어가 중요하면 로컬 SD, 심미적 결과가 중요하면 클라우드 모델 선택.

주의사항 또는 알려진 한계:

디퓨전 모델은 텍스트 이해도가 뛰어나지만, 수치적 계산이나 정교한 텍스트 렌더링(DALL-E 3 제외) 등에서는 여전히 한계가 있을 수 있음.

🧪 검증 상태 (Validation)

정보 상태: verified
출처 신뢰도: B
검토 이유: 해당 없음

🧬 중복 검사 (Duplicate Check)

기존 유사 문서: Diffusion Models, 디퓨전 모델 (Diffusion Models), 확산 모델 (Diffusion Models)
처리 방식: MERGE
처리 이유: 확산 모델과 관련된 이론적 정의와 플랫폼별 특성을 담은 3개 문서를 통합하여 기술적 깊이를 더함.

⚠️ 모순 및 업데이트 (Contradictions & Updates)

과거 데이터와의 충돌: 없음
정책 변화: 단순 이미지 생성을 넘어 '연산 자원 효율성'과 '로컬 제어의 복잡성' 문제를 함께 다룸.

🔗 지식 연결 (Graph)

Parent: 10_Wiki/Topics
Related: CFG_스케일_제어, 미드저니_매개변수_제어, 부정_프롬프트_제어
Raw Source: 직접 입력

🕓 변경 이력 (Changelog)

날짜	변경 내용	처리 방식	신뢰도
2026-05-07	3개 중복 문서를 통합 및 v3.0 규격 적용	MERGE	B

5.0 KiB Raw Blame History