Files
2nd/10_Wiki/Topics/Pooling.md
T
2026-05-02 23:33:34 +09:00

2.3 KiB


id: P-Reinforce-AUTO-POOL-001 category: Unified confidence_score: 0.95 tags: [auto-reinforced, pooling, cnn, Computer-Vision, Deep-Learning, dimension-reduction] last_reinforced: 2026-04-20

Pooling

📌 한 줄 통찰 (The Karpathy Summary)

"지적 요약의 힘: 이미지의 미세한 픽셀 정보를 다 가지고 있지 않아도, 핵심적인 특징(예: 코너나 엣지)만 골라내어 크기를 확 줄임으로써, 인공 신경망이 정보 과부하에 빠지지 않고 중요한 것에만 집중하게 만드는 다이어트 기법."

📖 구조화된 지식 (Synthesized Content)

풀링(Pooling)은 합성곱 신경망(CNN)에서 특성 지도의 해상도를 낮춰 연산량을 줄이고 중요한 특징을 강조하는 과정입니다.

  1. 대표적 기법:
    • Max Pooling: 해당 영역에서 가장 큰 값(가장 두드러진 특징)만 남김. (가장 널리 쓰임)
    • Average Pooling: 영역의 평균값을 취함 (부드러운 요약).
  2. 이점:
    • Invariance: 사물이 이미지 안에서 살짝 옆으로 이동해도 동일하게 인식하는 강인함 제공.
    • Computational Efficiency: 데이터 크기를 줄여 연산 속도 향상. (Efficiency와 연결)
    • Overfitting Reduction: 세세한 부분(Noise)을 뭉개버려 과적합 방지. (Overfitting와 연결)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 무조건 데이터 크기를 줄이는 정책이 효율적이라 믿었으나, 현대 정책은 정보 보존 정책을 중시하여 풀링 대신 보폭(Stride)을 넓린 합성곱(Strided Convolution) 정책을 사용해 정보 손실을 최소화하기도 함(RL Update).
  • 정책 변화(RL Update): 최근의 트랜스포머 기반 비전 모델(ViT) 정책에서는 풀링 대신 '패치 임베딩' 정책이나 'Layer Norm' 정책 등을 활용해 전역적인 맥락을 더 정교하게 파악하는 방향으로 진화 중임.

🔗 지식 연결 (Graph)