chore: update graph view scale and set workspace default tab to graph view
This commit is contained in:
@@ -0,0 +1,111 @@
|
||||
---
|
||||
# ──────────────────────────────────────────────
|
||||
# FRONTMATTER 작성 가이드 (LLM용 주석 포함)
|
||||
# 이 주석들은 파일 저장 시 삭제하지 않아도 됩니다.
|
||||
# LLM이 각 필드를 채울 때 판단 기준으로 사용합니다.
|
||||
# ──────────────────────────────────────────────
|
||||
|
||||
id: "wiki-2026-0507-029"
|
||||
title: "데이터_사이언스_및_ML_엔지니어링"
|
||||
category: "[[10_Wiki/Topics]]"
|
||||
status: "verified"
|
||||
canonical_id: "self"
|
||||
aliases: ["Machine Learning", "Deep Learning", "ML", "Python", "Data Science", "Generative AI", "Neural Networks", "기계 학습", "데이터 사이언스"]
|
||||
duplicate_of: "none"
|
||||
source_trust_level: "B"
|
||||
confidence_score: 1.0
|
||||
tags: ["AI", "Machine Learning", "Deep Learning", "Data Science", "Generative AI", "MLOps"]
|
||||
raw_sources: ["직접 입력"]
|
||||
last_reinforced: "2026-05-07"
|
||||
github_commit: "pending"
|
||||
---
|
||||
|
||||
# 데이터_사이언스_및_ML_엔지니어링
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터로부터 가치를 추출하고 지능을 모델링하는 공학." 단순한 예측을 넘어, 대규모 데이터를 학습하여 새로운 콘텐츠를 생성하고(Generative AI), 복잡한 문제를 인공신경망으로 해결하는 현대 AI 기술의 근간.
|
||||
|
||||
---
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
|
||||
**추출된 패턴:**
|
||||
> 데이터 전처리(Cleaning)에서 시작하여 모델 학습(Training)과 최적화(Optimization)를 거쳐, 실제 서비스에 배포하고 모니터링하는 전 과정(MLOps)을 하나의 유기적인 파이프라인으로 구축하는 것이 핵심이다.
|
||||
|
||||
**세부 내용:**
|
||||
- **머신러닝 및 딥러닝 기초:**
|
||||
- **3대 학습 패러다임:** 지도 학습, 비지도 학습, 강화 학습.
|
||||
- **인공신경망 (Neural Networks):** 뇌의 뉴런 구조를 모방하여 다층적 추상화를 수행. CNN(이미지), RNN/Transformer(텍스트) 등 도메인별 특화 아키텍처 활용.
|
||||
- **생성형 AI (Generative AI):**
|
||||
- **디퓨전 모델 (Diffusion):** 노이즈를 점진적으로 제거하며 고품질 이미지를 생성하는 원리.
|
||||
- **과학적 예측 모델:** 기상 관측 데이터를 입력받아 온도, 풍향 등을 엔드투엔드로 예측하는 AI 기상 예보 파이프라인 등 실세계 데이터 분석 적용.
|
||||
- **LLM (Large Language Models):** 방대한 텍스트 데이터를 학습하여 맥락을 이해하고 텍스트를 생성.
|
||||
- **데이터 엔지니어링 및 사이언스:**
|
||||
- **EDA (Exploratory Data Analysis):** 데이터의 특성과 패턴을 시각화 및 통계적으로 파악.
|
||||
- **데이터 정제:** 결측치, 이상치 처리 및 피처 엔지니어링을 통한 모델 성능 극대화.
|
||||
- **MLOps 및 실전 배포:**
|
||||
- **실험 관리:** MLflow 등을 활용한 하이퍼파라미터 및 모델 버전 관리.
|
||||
- **서빙 아키텍처:** 모델을 API 형태로 배포하고 데이터 드리프트를 실시간 모니터링.
|
||||
|
||||
---
|
||||
|
||||
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
|
||||
|
||||
**언제 이 지식을 쓰는가:**
|
||||
- 데이터 기반의 예측 모델이나 추천 시스템을 기획하고 개발할 때.
|
||||
- Stable Diffusion, DALL-E 등 생성형 AI 모델의 작동 원리를 이해하고 커스텀 학습(LoRA 등)을 수행할 때.
|
||||
- 파이썬 기반의 데이터 분석 파이프라인을 구축하거나 성능 튜닝이 필요할 때.
|
||||
|
||||
**언제 이 지식을 쓰면 안 되는가:**
|
||||
- 단순한 규칙 기반 알고리즘으로 충분히 해결 가능한 문제.
|
||||
|
||||
**이 지식을 적용할 때의 권장 절차:**
|
||||
1. **문제 정의:** 비즈니스 목표를 데이터 사이언스 문제(분류, 회귀 등)로 치환.
|
||||
2. **데이터 확보 및 분석:** 원천 데이터를 수집하고 EDA를 통해 데이터의 질 파악.
|
||||
3. **모델링:** 데이터 크기와 복잡도에 따라 적절한 알고리즘(트리 기반 vs 신경망) 선택.
|
||||
4. **평가 및 최적화:** 정밀도(Precision), 재현율(Recall) 등 지표를 기반으로 모델 튜닝.
|
||||
5. **배포 및 관리:** MLOps 프로세스에 따라 모델을 배포하고 지속적으로 성능 관리.
|
||||
|
||||
**주의사항 또는 알려진 한계:**
|
||||
- **데이터 의존성:** 모델의 성능은 학습 데이터의 양과 질에 절대적으로 의존함 (GIGO).
|
||||
- **모델 붕괴 (Model Collapse):** AI가 생성한 합성 데이터를 다시 학습에 활용할 경우, 시간이 지남에 따라 모델의 정확성과 신뢰성이 저하되는 현상 주의.
|
||||
- **해석 가능성:** 복잡한 딥러닝 모델은 결과 도출 근거를 설명하기 어려울 수 있으므로 XAI 기법 병행 권장.
|
||||
|
||||
---
|
||||
|
||||
## 🧪 검증 상태 (Validation)
|
||||
|
||||
- **정보 상태:** verified
|
||||
- **출처 신뢰도:** B
|
||||
- **검토 이유:** 해당 없음
|
||||
|
||||
---
|
||||
|
||||
## 🧬 중복 검사 (Duplicate Check)
|
||||
|
||||
- **기존 유사 문서:** [[Machine Learning (ML)]], [[Deep-Learning]], [[Neural Networks]], [[Generative AI]], [[Diffusion 모델 작동 원리]] 등 150여 개
|
||||
- **처리 방식:** MERGE
|
||||
- **처리 이유:** 기초 통계부터 딥러닝, 생성형 AI, 그리고 MLOps까지 AI 엔지니어링 전반을 다룬 수많은 중복 문서를 통합하여 전사적 AI 지능 아키텍처 표준으로 구축함.
|
||||
|
||||
---
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
|
||||
|
||||
- **과거 데이터와의 충돌:** 없음
|
||||
- **정책 변화:** 단순한 분석 도구 활용에서 '데이터 중심(Data-centric)의 파이프라인 자동화' 및 '생성형 AI의 실전적 응용'으로 초점 이동.
|
||||
|
||||
---
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
|
||||
- **Parent:** [[10_Wiki/Topics]]
|
||||
- **Related:** [[AGI_및_지능형_에이전트_설계]], [[벡터_DB_및_RAG_검색_고도화]], [[AI_이미지_생성_워크플로우]]
|
||||
- **Raw Source:** 직접 입력
|
||||
|
||||
---
|
||||
|
||||
## 🕓 변경 이력 (Changelog)
|
||||
|
||||
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|
||||
|------|-----------|-----------|--------|
|
||||
| 2026-05-07 | 150개 이상의 AI/ML/데이터 사이언스 관련 중복 문서를 통합 및 v3.0 규격 적용 | MERGE | B |
|
||||
Reference in New Issue
Block a user