Files
2nd/10_Wiki/Topics_Blog/Image-Classification-Mastery.md
T

29 lines
2.2 KiB
Markdown

---
id: CV-CLASS-001
category: "10_Wiki/💡 Topics/AI"
confidence_score: 1.0
tags: [computer-vision, deep-learning, image-classification, cnn, vit]
last_reinforced: 2026-04-26
---
# Image Classification Mastery (이미지 분류 마스터리)
## 📌 한 줄 통찰 (The Karpathy Summary)
> "픽셀의 뭉치에서 사물의 특징(Feature)을 추출하여, 기계가 세상을 명명(Labeling)하게 하라" — 입력 이미지를 미리 정의된 여러 카테고리 중 하나(또는 그 이상)로 분류하는 컴퓨터 비전의 핵심 태스크이자, 모든 시각 지능 시스템의 시작점.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** 이미지의 국소적 특징(선, 면, 질감)을 하위 레이어에서 추출하고, 이를 상위 레이어에서 조합하여 사물의 고유한 형태를 인식하는 계층적 특징 학습 패턴.
- **핵심 아키텍처:**
- **CNN (Convolutional Neural Networks):** 공간적 구조를 보존하며 특징을 추출하는 고전적 강자 (ResNet, EfficientNet).
- **Vision Transformer (ViT):** 이미지를 패치 단위로 나누어 어텐션 메커니즘을 적용, 전역적인 맥락 파악에 유리.
- **Transfer Learning:** 거대 데이터셋(ImageNet 등)으로 사전 학습된 모델을 활용하여 소량의 데이터로도 고성능 구현.
- **의의:** 자율주행, 의료 영상 진단, 콘텐츠 필터링 등 이미지가 데이터로 사용되는 거의 모든 산업의 기반 기술.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 정적인 이미지를 분류하던 단계를 넘어, 이제는 텍스트와 이미지를 동시에 이해하는 멀티모달(CLIP 등) 모델을 통해 '문맥적 분류'가 가능한 시대로 진화.
- **정책 변화:** Antigravity 프로젝트는 수집된 이미지 자료(`00_Raw/Images`)를 자동으로 인덱싱하고 위키 카테고리에 할당하기 위해 최신 ViT 기반의 분류 엔진을 상시 가동함.
## 🔗 지식 연결 (Graph)
- Object-Detection-Mastery, [[Image-Segmentation-Techniques|Image-Segmentation-Techniques]], Deep-Learning-Foundations, Computer-Vision-Mastery
- **Raw Source:** 10_Wiki/Topics/AI/Image-Classification-Mastery.md