feat: achieve 600 files milestone in AI knowledge base

This commit is contained in:
2026-04-20 19:10:32 +09:00
parent ed5140096e
commit ae1627c35b
713 changed files with 21197 additions and 1994 deletions
+20 -15
View File
@@ -1,27 +1,32 @@
---
id: P-REINFORCE-AI-CV
id: P-REINFORCE-AUTO-COVI-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.99
tags: [Computer Vision, Deep Learning, Image Processing, Object Detection]
confidence_score: 0.98
tags: [auto-reinforced, computer-vision, deep-learning, pattern-recognition, image-processing, perception]
last_reinforced: 2026-04-20
---
# [[Computer-Vision]] (컴퓨터 비전)
# [[Computer Vision]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "기계에게 눈을 부여하는 기술." 픽셀 데이터에서 패턴을 찾아내고, 그것이 '고양이'인지 '보행자'인지, 아니면 '암세포'인지 해석하는 AI의 시각 시스템이다.
> "디지털 눈의 진화: 픽셀의 단순한 나열인 이미지와 비디오 데이터를 컴퓨터가 인간처럼 이해하고, 객체를 식별하며, 공간의 깊이를 읽고, 의미 있는 정보를 추출하게 만드는 인공지능의 시각 중추."
## 📖 구조화된 지식 (Synthesized Content)
- **Image Recognition & Classification**:
- 사진을 보고 무엇인지 레이블링하는 기초 단계. CNN(Convolutional Neural Networks)의 등장으로 혁명적인 변화가 일어났다.
- **Object Detection & Segmentation**:
- 화면 안의 사물 위치를 박스로 표시(Detection)하거나, 픽셀 단위로 경계를 칠하는(Segmentation) 정밀 작업. 자율주행의 핵심이다.
- **Vision Transformers (ViT)**:
- 최근 NLP에서 쓰이는 'Attention' 기법을 이미지 처리에 도입하여, 기존 CNN의 한계를 넘어서는 성능을 보여주고 있다.
컴퓨터 비전(Computer Vision)은 가시광선 등 물리적 신호를 디지털 데이터로 변환하고 분석하여 '본다'는 행위를 기계로 구현하는 기술입니다.
## ⚠️ 모순 및 업데이트 (RL Update)
- 컴퓨터 비전은 빛의 조건, 가림(Occlusion), 앵글의 변화에 여전히 취약한 면이 있다. 이를 극복하기 위해 다각도 카메라와 라이다(LiDAR) 데이터를 합치는 '센서 퓨전(Sensor Fusion)' 기술이 활발히 연구되고 있다.
1. **핵심 태스크**:
* **Classification**: 무엇이 들어있는가? (예: 개/고양이 구분)
* **Detection**: 무엇이 '어디에' 있는가? (Bounding Box 표시)
* **Segmentation**: 픽셀 단위로 객체의 경계선 따기.
* **Depth Estimation**: 공간의 입체적 거리감 파악.
2. **기반 기술**:
* CNN(Convolutional Neural Networks)에서 최근에는 Vision Transformers(ViT)로 아키텍처가 진화 중.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 필터 제작 등 수동 특징 추출(Hand-crafted features) 정책 위주였으나, 현대 정책은 데이터로부터 스스로 특징을 배우는 '딥러닝 기반 종단간 학습 정책(End-to-end)'으로 완전히 전환됨(RL Update).
- **정책 변화(RL Update)**: 2D 이미지 분석 정책을 넘어, 최근에는 '3D 공간 지능 정책'과 '멀티모달(시각+언어) 통합 정책'이 자율주행과 에이전틱 서비스의 핵심 정책 토대가 됨.
## 🔗 지식 연결 (Graph)
- Related: [[Autonomous-Vehicle-Path-Planning]] , [[Robotic Manipulation]]
- Foundation: [[Information Theory]]
- [[Pattern Recognition]], [[Autonomous Vehicles]], [[CV_Synthesis]], [[Artificial Intelligence (AI)]], [[Robotics]]
- **Modern Tech/Tools**: OpenCV, PyTorch/TensorFlow, YOLO, Segment Anything Model (SAM), NeRF.
---