2.3 KiB
2.3 KiB
id: CV-CLASS-001 category: "10_Wiki/💡 Topics/AI" confidence_score: 1.0 tags: Computer Vision, Deep-Learning, image-classification, cnn, vit] last_reinforced: 2026-04-26
Image Classification Mastery (이미지 분류 마스터리)
📌 한 줄 통찰 (The Karpathy Summary)
"픽셀의 뭉치에서 사물의 특징(Feature)을 추출하여, 기계가 세상을 명명(Labeling)하게 하라" — 입력 이미지를 미리 정의된 여러 카테고리 중 하나(또는 그 이상)로 분류하는 컴퓨터 비전의 핵심 태스크이자, 모든 시각 지능 시스템의 시작점.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: 이미지의 국소적 특징(선, 면, 질감)을 하위 레이어에서 추출하고, 이를 상위 레이어에서 조합하여 사물의 고유한 형태를 인식하는 계층적 특징 학습 패턴.
- 핵심 아키텍처:
- CNN (Convolutional Neural Networks): 공간적 구조를 보존하며 특징을 추출하는 고전적 강자 (ResNet, EfficientNet).
- Vision Transformer (ViT): 이미지를 패치 단위로 나누어 어텐션 메커니즘을 적용, 전역적인 맥락 파악에 유리.
- Transfer Learning: 거대 데이터셋(ImageNet 등)으로 사전 학습된 모델을 활용하여 소량의 데이터로도 고성능 구현.
- 의의: 자율주행, 의료 영상 진단, 콘텐츠 필터링 등 이미지가 데이터로 사용되는 거의 모든 산업의 기반 기술.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 단순히 정적인 이미지를 분류하던 단계를 넘어, 이제는 텍스트와 이미지를 동시에 이해하는 멀티모달(CLIP 등) 모델을 통해 '문맥적 분류'가 가능한 시대로 진화.
- 정책 변화: Antigravity 프로젝트는 수집된 이미지 자료(
00_Raw/Images)를 자동으로 인덱싱하고 위키 카테고리에 할당하기 위해 최신 ViT 기반의 분류 엔진을 상시 가동함.
🔗 지식 연결 (Graph)
- Object-Detection-Mastery, Image-Segmentation-Techniques, Deep-Learning-Foundations, Computer-Vision-Mastery
- Raw Source: 10_Wiki/Topics/AI/Image-Classification-Mastery.md