# [[클릭 모델링 (Click Modeling)]]

## 📌 Brief 수동 평가자를 동원하여 검색 결과의 관련성을 수동으로 라벨링하는 대신, 검색 결과에 대한 클릭, 장바구니 담기, 구매 등 실제 사용자의 상호작용 데이터(Usage data)를 기반으로 판단 목록(Judgment list)을 생성하는 과정을 의미합니다 [1]. 이는 과거 검색 결과로 제공된 문서가 사용자에게 얼마나 적합했는지를 추정하기 위해 활용됩니다 [1].

## 📖 Core Content
* **자동화된 훈련 데이터 구축:** 클릭 모델링은 기계 학습 기반의 랭킹(Learning to Rank, LTR) 알고리즘을 훈련시키기 위해 필수적인 판단 목록을 자동으로 구성하는 데 사용됩니다 [1, 2]. 사람이 직접 평가하는 대신, 실제 클릭률(Clickthrough logs)과 같은 사용자 참여 데이터를 분석하여 이상적인 검색 결과 순위를 학습할 수 있는 데이터를 도출합니다 [2, 3].
* **다양한 클릭 신호 활용:** 단순히 검색 결과 링크를 클릭하는 것뿐만 아니라, 상품의 장바구니 추가, 최종 구매, 또는 오디오를 끝까지 듣는 행위 등 사용자의 다양한 행동 신호(Click signals)가 문서의 관련성을 평가하는 지표로 종합적으로 활용됩니다 [1].
* **실험적 접근의 필요성:** 클릭 모델링을 검색 시스템에 최적화하여 적용하는 것은 과학인 동시에 예술적인 영역으로 간주되며, 정확한 모델을 구축하기 위해서는 여러 번의 반복적인 실험이 필요합니다 [1].

## ⚖️ Trade-offs & Caveats
* **편향(Bias)의 개입:** 클릭 데이터를 활용한 모델링에서 발생하는 가장 큰 기술적 제약과 부작용은 수집된 클릭 로그에 편향이 포함될 수 있다는 점입니다 [1, 3].
* **위치 편향(Position Bias):** 사용자는 최상단에 노출된 검색 결과가 이미 잘 정렬되어 있고 가장 관련성이 높을 것이라고 가정하는 경향이 있습니다 [3]. 이로 인해 실제 문서의 질이나 적합도와 무관하게 상단에 위치한 문서가 더 많이 클릭되는 '위치 편향'이 발생하며, 이는 클릭 모델링 과정에서 데이터의 정확성을 왜곡하는 주요 원인이 됩니다 [1, 3].

---
*Last updated: 2026-05-04*