# [[기계 ν•™μŠ΅ (Machine Learning)]] ## πŸ“Œ Brief Summary 기계 ν•™μŠ΅(Machine Learning)은 기계가 μΈκ°„μ²˜λŸΌ 데이터λ₯Ό λΆ„μ„ν•˜κ³  ν•™μŠ΅ν•˜λ„λ‘ ν›ˆλ ¨μ‹œν‚€λŠ” 인곡지λŠ₯(AI) κ³Όν•™μ˜ ν•œ λΆ„μ•Όμž…λ‹ˆλ‹€ [1]. 검색 μ‹œμŠ€ν…œμ—μ„œ 기계 ν•™μŠ΅μ€ λŒ€λŸ‰μ˜ 데이터와 μ‚¬μš©μž μƒν˜Έμž‘μš©μ„ λΆ„μ„ν•˜μ—¬ 질의의 λ¬Έλ§₯을 μ΄ν•΄ν•˜κ³ , νŒ¨ν„΄μ„ μ‹λ³„ν•˜λ©°, 관련성을 기반으둜 검색 결과의 μˆœμœ„λ₯Ό λ§€κΈ°λŠ” 핡심적인 역할을 μˆ˜ν–‰ν•©λ‹ˆλ‹€ [2-4]. 지도 ν•™μŠ΅, 비지도 ν•™μŠ΅, κ°•ν™” ν•™μŠ΅ λ“± λ‹€μ–‘ν•œ ν›ˆλ ¨ 기법을 톡해 μ§€μ†μ μœΌλ‘œ μ•Œκ³ λ¦¬μ¦˜ μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λ©°, λ‹¨μˆœν•œ ν‚€μ›Œλ“œ 맀칭을 λ„˜μ–΄μ„œλŠ” μ •κ΅ν•œ κ°œμΈν™” 및 의미둠적 검색 ν™˜κ²½μ„ μ œκ³΅ν•©λ‹ˆλ‹€ [2, 5]. ## πŸ“– Core λŒ€λΆ„λ₯˜ * **검색 λž­ν‚Ή μ΅œμ ν™” (Learning to Rank, LTR):** 기계 ν•™μŠ΅ λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬ 검색 결과의 κ΄€λ ¨μ„± 점수λ₯Ό μ΅œμ ν™”ν•˜λŠ” λž­ν‚Ή ν•¨μˆ˜λ₯Ό κ΅¬μΆ•ν•©λ‹ˆλ‹€ [5, 6]. LTR λͺ¨λΈμ€ 질의, λ¬Έμ„œ, 그리고 질의-λ¬Έμ„œ κ΄€κ³„μ—μ„œ μΆ”μΆœλœ λ‹€μ–‘ν•œ ν”Όμ²˜(Feature)와 κ΄€λ ¨μ„± νŒλ‹¨ 리슀트λ₯Ό κ²°ν•©ν•˜μ—¬ ν•™μŠ΅ 데이터λ₯Ό κ΅¬μ„±ν•©λ‹ˆλ‹€ [7, 8]. λž­ν‚Ή λͺ¨λΈμ€ Pointwise, Pairwise, Listwise λ“± μ„Έ κ°€μ§€ μ£Όμš” μ ‘κ·Όλ²•μœΌλ‘œ λ‚˜λ‰˜λ©°, LambdaMARTλ‚˜ XGBoost와 같은 κ·Έλž˜λ””μ–ΈνŠΈ λΆ€μŠ€νŒ… μ˜μ‚¬κ²°μ • 트리(GBDT) μ•Œκ³ λ¦¬μ¦˜μ΄ 널리 μ‚¬μš©λ©λ‹ˆλ‹€ [6, 9-11]. * **κ°œμΈν™” 및 μ‚¬μš©μž νŒ¨ν„΄ 인식:** 기계 ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜μ€ μ‚¬μš©μžμ˜ 검색 νžˆμŠ€ν† λ¦¬, 클릭 데이터, νŽ˜μ΄μ§€ 체λ₯˜ μ‹œκ°„ 등을 λΆ„μ„ν•˜μ—¬ ν–₯ν›„ 행동을 μ˜ˆμΈ‘ν•˜λŠ” λͺ¨λΈμ„ κ°œλ°œν•©λ‹ˆλ‹€ [6, 12, 13]. μ‹€μ‹œκ°„ ν”Όλ“œλ°±μ„ μ²˜λ¦¬ν•˜μ—¬ 검색 κ²°κ³Όλ₯Ό λ™μ μœΌλ‘œ μž¬μ‘°μ •ν•˜λ©°, ν΄λŸ¬μŠ€ν„°λ§(Clustering) κΈ°μˆ μ„ 톡해 μœ μ‚¬ν•œ 행동 νŒ¨ν„΄μ„ κ°€μ§„ μ‚¬μš©μž 그룹의 μ„ ν˜Έλ„λ₯Ό λ°˜μ˜ν•˜μ—¬ κ³ λ„λ‘œ λ§žμΆ€ν™”λœ 검색 κ²½ν—˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€ [12, 14, 15]. * **의미둠적 검색(Semantic Search) κΈ°λŠ₯ ν–₯상:** μžμ—°μ–΄ 처리(NLP)와 κ²°ν•©λœ 기계 ν•™μŠ΅μ€ 검색어가 λ‚΄ν¬ν•œ μ˜λ„μ™€ λ¬Έλ§₯을 이해할 수 μžˆλ„λ‘ μ§„ν™”ν–ˆμŠ΅λ‹ˆλ‹€ [2, 16]. κ΅¬κΈ€μ˜ RankBrainμ΄λ‚˜ BERT 같은 트랜슀포머 기반의 신경망 기법은 λ°©λŒ€ν•œ ν…μŠ€νŠΈ 데이터λ₯Ό 톡해 μ–Έμ–΄ 관계λ₯Ό ν•™μŠ΅ν•˜κ³ , 단어와 λ¬Έμž₯을 고차원 벑터 μž„λ² λ”©(Vector Embeddings)으둜 λ³€ν™˜ν•˜μ—¬ μˆ˜ν•™μ  μœ μ‚¬μ„±μ„ μΈ‘μ •ν•˜λŠ” λ°©μ‹μœΌλ‘œ 정확도 높은 κ²°κ³Όλ₯Ό λ„μΆœν•©λ‹ˆλ‹€ [17-20]. * **핡심 데이터 λͺ¨λΈλ§ 기술 적용:** 데이터 κ³Όν•™ ν”„λ‘œμ„ΈμŠ€ λ‚΄μ—μ„œ μ•Œλ €μ§„ 데이터 집합을 기반으둜 데이터λ₯Ό μ •λ ¬ν•˜λŠ” 방법을 기계에 ν•™μŠ΅μ‹œν‚΅λ‹ˆλ‹€ [15]. 주둜 데이터λ₯Ό νŠΉμ • λ²”μ£Όλ‘œ λΆ„λ₯˜(Classification)ν•˜κ±°λ‚˜, κ²‰μœΌλ‘œ 관련이 μ—†μ–΄ λ³΄μ΄λŠ” μš”μ†Œ κ°„μ˜ 관계λ₯Ό μ°ΎλŠ” νšŒκ·€(Regression), κ³ μ •λœ λ²”μ£Όλ‘œ μ •ν™•νžˆ λ‚˜λˆŒ 수 μ—†λŠ” 데이터λ₯Ό 밀접성에 따라 λ¬ΆλŠ” ν΄λŸ¬μŠ€ν„°λ§(Clustering) 기술 등을 데이터 λͺ¨λΈλ§μ— ν™œμš©ν•©λ‹ˆλ‹€ [15, 21, 22]. ## βš–οΈ Trade-offs & Caveats * **편ν–₯μ„±(Bias) 상속 및 λΆˆν™•μ‹€μ„±:** 기계 ν•™μŠ΅ λͺ¨λΈμ€ μ „μ μœΌλ‘œ ν›ˆλ ¨ 데이터에 μ˜μ‘΄ν•˜λ―€λ‘œ 데이터에 λ‚΄μž¬λœ 편ν–₯κ³Ό νŽΈκ²¬μ„ κ·ΈλŒ€λ‘œ 상속받고 μ¦ν­μ‹œν‚¬ 수 μžˆλŠ” μ œμ•½μ΄ μžˆμŠ΅λ‹ˆλ‹€ [23, 24]. 예λ₯Ό λ“€μ–΄ νŠΉμ • 인ꡬ톡계학적 νŠΉμ„±μ— νŽΈμ€‘λœ λ°μ΄ν„°λ‘œ ν›ˆλ ¨λœ 경우, ν•™μŠ΅λ˜μ§€ μ•Šμ€ λ‹€λ₯Έ 그룹에 λŒ€ν•œ 예츑 정확도가 ν˜„μ €νžˆ λ–¨μ–΄μ§€λŠ” λΆˆκ· ν˜• ν˜„μƒμ΄ λ°œμƒν•©λ‹ˆλ‹€ [25]. * **ν•„ν„° 버블(Filter Bubbles) 유발:** 기계 ν•™μŠ΅ 기반의 κ³ λ„ν™”λœ κ°œμΈν™” μ‹œμŠ€ν…œμ€ μ‚¬μš©μžμ˜ κ³Όκ±° ν–‰λ™μ΄λ‚˜ μƒν˜Έμž‘μš©λ§Œμ„ νλ ˆμ΄μ…˜μ˜ κΈ°μ€€μœΌλ‘œ 삼을 μœ„ν—˜μ΄ μžˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” μ‚¬μš©μžλ₯Ό μ΅μˆ™ν•œ μ •λ³΄μ—λ§Œ κ³ λ¦½μ‹œμΌœ λ‹€μ–‘ν•œ 관점과 μ •λ³΄λ‘œλΆ€ν„° λ©€μ–΄μ§€κ²Œ ν•˜λŠ” ν•„ν„° 버블 ν˜„μƒμ„ μ΄ˆλž˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€ [23, 24]. * **해석 κ°€λŠ₯μ„±(Interpretability) λΆ€μ‘±:** 기계 ν•™μŠ΅ λͺ¨λΈμ΄ μƒμ„±ν•˜λŠ” 벑터 ν‘œν˜„μ΄λ‚˜ λž­ν‚Ή μ‚°μΆœ κ·Όκ±°λŠ” μˆ˜λ§Žμ€ 숫자의 λ°°μ—΄μ΄κ±°λ‚˜ λΈ”λž™λ°•μŠ€ ν˜•νƒœλ₯Ό 띠기 λ•Œλ¬Έμ—, 인간이 μ•Œκ³ λ¦¬μ¦˜μ˜ νŠΉμ • κ²°μ • 이유λ₯Ό μ§κ΄€μ μœΌλ‘œ μ΄ν•΄ν•˜κΈ° μ–΄λ ΅μŠ΅λ‹ˆλ‹€ [26]. μ΄λŠ” 법λ₯ , 의료 λ“± AI 결과의 μ„€λͺ… κ°€λŠ₯성이 ν•„μˆ˜μ μΈ λΆ„μ•Όμ—μ„œ μ‹¬κ°ν•œ ν•œκ³„λ‘œ μž‘μš©ν•©λ‹ˆλ‹€ [26]. * **μ λŒ€μ  곡격(Adversarial Attacks) λ…ΈμΆœ:** 심측 신경망을 ν™œμš©ν•œ μ΅œμ‹  λž­ν‚Ή μ•Œκ³ λ¦¬μ¦˜μ€ 인간이 인지할 수 μ—†λŠ” μˆ˜μ€€μ˜ λ―Έμ„Έν•œ λ…Έμ΄μ¦ˆλ‚˜ λ³€ν˜•μ„ μ£Όμž…ν•˜λŠ” μ€λ°€ν•œ μ λŒ€μ  곡격에 μ·¨μ•½ν•˜λ©°, μ΄λŸ¬ν•œ 곡격에 μ˜ν•΄ 검색 λž­ν‚Ή μˆœμœ„κ°€ μž„μ˜λ‘œ μ‘°μž‘λ  μœ„ν—˜μ„±μ΄ μ‘΄μž¬ν•©λ‹ˆλ‹€ [27]. * **높은 μ»΄ν“¨νŒ… λ¦¬μ†ŒμŠ€ 및 μ½œλ“œ μŠ€νƒ€νŠΈ(Cold Start) ν•œκ³„:** λ³΅μž‘ν•œ 기계 ν•™μŠ΅ λͺ¨λΈ ν›ˆλ ¨κ³Ό λŒ€κ·œλͺ¨ 고차원 데이터 μ²˜λ¦¬μ—λŠ” μƒλ‹Ήν•œ μ—°μ‚° μžμ›κ³Ό λ§‰λŒ€ν•œ λ°μ΄ν„°λ² μ΄μŠ€ μœ μ§€ λΉ„μš©μ΄ λ°œμƒν•©λ‹ˆλ‹€ [28, 29]. λ˜ν•œ, 데이터 μ„ΈνŠΈμ— μƒˆλ‘œ μΆ”κ°€λ˜μ–΄ ν•™μŠ΅ 정보가 λΆ€μ‘±ν•œ μ΅œμ‹  ν•­λͺ©μ˜ 경우 μœ μ‚¬μ„±μ„ μ •ν™•νžˆ νŒλ³„ν•˜κΈ° μ–΄λ €μš΄ β€˜μ½œλ“œ μŠ€νƒ€νŠΈβ€™ λ¬Έμ œμ— μ§λ©΄ν•˜κ²Œ λ©λ‹ˆλ‹€ [26]. --- *Last updated: 2026-05-04*