# [[Machine Learning Bias]] ## πŸ“Œ Brief Summary 기계 ν•™μŠ΅ 편ν–₯(Machine Learning Bias)은 ν›ˆλ ¨ λ°μ΄ν„°λ‚˜ λͺ¨λΈμ˜ 예츑 λ™μž‘μ— μžˆμ–΄ μ—°λ Ή, μ†Œλ“ 계측 λ“± λ‹€μ–‘ν•œ κ·Έλ£Ή 간에 λΆˆκ· ν˜•μ΄ μ‘΄μž¬ν•˜λŠ” ν˜„μƒμ„ μ˜λ―Έν•©λ‹ˆλ‹€ [1]. 기계 ν•™μŠ΅ λͺ¨λΈκ³Ό 벑터 μž„λ² λ”©μ€ ν›ˆλ ¨ 데이터에 λ‚΄μž¬λœ 편ν–₯을 μ˜λ„μΉ˜ μ•Šκ²Œ 상속받아 μΈμ½”λ”©ν•˜κ³  μ¦ν­μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€ [2, 3]. λ”°λΌμ„œ κ³΅μ •ν•˜κ³  편ν–₯λ˜μ§€ μ•Šμ€ κ²°κ³Όλ₯Ό 보μž₯ν•˜κΈ° μœ„ν•΄μ„œλŠ” κ°œλ°œμžλ“€μ΄ 편ν–₯을 적극적으둜 감지, μΈ‘μ • 및 μ™„ν™”ν•΄μ•Ό ν•©λ‹ˆλ‹€ [1, 2]. ## πŸ“– Core Content * **ν›ˆλ ¨ λ°μ΄ν„°μ˜ λΆˆκ· ν˜•μœΌλ‘œ μΈν•œ 편ν–₯ λ°œμƒ:** 기계 ν•™μŠ΅ λ„κ΅¬λŠ” μ „μ μœΌλ‘œ μ •ν™•ν•˜μ§€ μ•ŠμœΌλ©° λΆˆν™•μ‹€μ„±μ΄λ‚˜ 편ν–₯을 내포할 수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, 기계 ν•™μŠ΅ 도ꡬ가 주둜 μ€‘λ…„μΈ΅μ˜ 데이터λ₯Ό λ°”νƒ•μœΌλ‘œ ν›ˆλ ¨λ˜μ—ˆλ‹€λ©΄, μ²­λ…„μΈ΅μ΄λ‚˜ κ³ λ ΉμΈ΅κ³Ό κ΄€λ ¨λœ μ˜ˆμΈ‘μ„ μˆ˜ν–‰ν•  λ•Œ 정확도가 λ–¨μ–΄μ§€λŠ” λΆˆκ· ν˜• ν˜„μƒ(편ν–₯)이 λ°œμƒν•©λ‹ˆλ‹€ [1]. * **벑터 μž„λ² λ”©κ³Ό 검색 μ‹œμŠ€ν…œ λ‚΄μ˜ 편ν–₯ 증폭:** 벑터 검색 등에 μ‚¬μš©λ˜λŠ” 기계 ν•™μŠ΅ λͺ¨λΈμ€ ν›ˆλ ¨ 데이터에 μ‘΄μž¬ν•˜λŠ” 편ν–₯을 상속받아 μ¦ν­μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€ [2]. 벑터 μž„λ² λ”© μ—­μ‹œ λ°μ΄ν„°μ˜ 편ν–₯을 μ˜λ„μΉ˜ μ•Šκ²Œ 인코딩할 수 μžˆμœΌλ―€λ‘œ, ν˜•ν‰μ„± μžˆλŠ” 검색 κ²°κ³Όλ₯Ό μœ μ§€ν•˜κΈ° μœ„ν•΄ 개발자의 적극적인 κ°œμž…κ³Ό 편ν–₯ 제거 λ…Έλ ₯이 ν•„μš”ν•©λ‹ˆλ‹€ [3]. * **μ‚¬μš©μž 행동 데이터에 λ‚΄μž¬λœ 편ν–₯:** 검색 결과의 μˆœμœ„λ₯Ό ν•™μŠ΅ν•˜κΈ° μœ„ν•΄ μ‚¬μš©μž 행동 데이터(예: 클릭 둜그)λ₯Ό μ‚¬μš©ν•  λ•Œλ„ μ—¬λŸ¬ 편ν–₯이 κ°œμž…λ©λ‹ˆλ‹€ [4, 5]. λŒ€ν‘œμ μœΌλ‘œ μ‚¬μš©μžλŠ” μƒμœ„μ— 랭크된 κ²°κ³Όκ°€ 이미 관련성이 높을 것이라고 κ°€μ •ν•˜μ—¬ 상단 검색 κ²°κ³Όλ₯Ό 주둜 ν΄λ¦­ν•˜λŠ” κ²½ν–₯이 μžˆλŠ”λ°, μ΄λŠ” ν›ˆλ ¨ 데이터에 'μœ„μΉ˜ 편ν–₯(Position bias)'을 μœ λ°œν•©λ‹ˆλ‹€ [4, 5]. * **ν•„ν„° 버블(Filter Bubbles) ν˜•μ„±:** 검색 μ•Œκ³ λ¦¬μ¦˜μ΄ μ‚¬μš©μžμ˜ κ³Όκ±° 행동, μ„ ν˜Έλ„ 및 μƒν˜Έμž‘μš©μ„ 기반으둜 μ½˜ν…μΈ λ₯Ό 선별할 λ•Œ ν•„ν„° 버블이 λ°œμƒν•  수 μžˆμŠ΅λ‹ˆλ‹€ [2]. μ΄λŠ” μ‚¬μš©μžλ₯Ό λ‹€μ–‘ν•œ 관점과 μ •λ³΄λ‘œλΆ€ν„° κ³ λ¦½μ‹œν‚€κ³  쒁은 μ‹œκ°μ„ κ°–κ²Œ λ§Œλ“€λ©°, 기쑴의 신념과 편ν–₯을 λ”μš± κ°•ν™”ν•˜λŠ” κ²°κ³Όλ₯Ό μ΄ˆλž˜ν•©λ‹ˆλ‹€ [2]. ## βš–οΈ Trade-offs & Caveats * **μ •ν™•μ„±μ˜ ν•œκ³„μ™€ 지속적 관리 λΉ„μš©:** 기계 ν•™μŠ΅ λ„κ΅¬λŠ” 본질적으둜 μ™„λ²½ν•˜κ²Œ μ •ν™•ν•˜μ§€ μ•ŠκΈ° λ•Œλ¬Έμ—, 검색 및 예츑 μ•Œκ³ λ¦¬μ¦˜μ„ μ΅œμ ν™”ν•˜λ”λΌλ„ 항상 λΆˆν™•μ‹€μ„±μ΄λ‚˜ 편ν–₯이 μ‘΄μž¬ν•  μœ„ν—˜μ„ μˆ˜λ°˜ν•©λ‹ˆλ‹€ [1]. λ”°λΌμ„œ κ³΅μ •ν•œ κ²°κ³Όλ₯Ό μœ μ§€ν•˜λ €λ©΄ κ°œλ°œμžκ°€ λŠμž„μ—†μ΄ λͺ¨λΈμ„ λͺ¨λ‹ˆν„°λ§ν•˜κ³  편ν–₯을 μ™„ν™”ν•˜λŠ” 좔가적인 관리 λΉ„μš©μ΄ λ“­λ‹ˆλ‹€ [2, 3]. * **κ°œμΈν™” μ΅œμ ν™”μ™€ ν•„ν„° λ²„λΈ”μ˜ λΆ€μž‘μš©:** μ‚¬μš©μž κ²½ν—˜μ„ ν–₯μƒμ‹œν‚€κΈ° μœ„ν•΄ 검색 κ²°κ³Όλ₯Ό μ‚¬μš©μžμ˜ 행동 νŒ¨ν„΄μ— 맞좰 κ³ λ„λ‘œ κ°œμΈν™”(μ΅œμ ν™”)ν•˜λ©΄, 결과적으둜 μ‚¬μš©μžκ°€ λ‹€μ–‘ν•œ 정보에 λ…ΈμΆœλ  κΈ°νšŒκ°€ μ°¨λ‹¨λ˜μ–΄ 편ν–₯을 λ‚³λŠ” 'ν•„ν„° 버블' ν˜„μƒμ΄ μ§™μ–΄μ§€λŠ” λ°˜λŒ€ κΈ‰λΆ€κ°€ λ°œμƒν•©λ‹ˆλ‹€ [2]. * **행동 데이터 ν™œμš©μ˜ μ œμ•½:** Learning to Rank(LTR)와 같은 λͺ¨λΈμ„ ν›ˆλ ¨μ‹œν‚€κΈ° μœ„ν•΄ 클릭λ₯  λ“± 행동 좔적 데이터λ₯Ό ν™œμš©ν•˜λ©΄ λͺ¨λΈμ˜ κ΄€λ ¨μ„± ν‰κ°€λŠ” ν–₯상될 수 μžˆμœΌλ‚˜, ν•„μ—°μ μœΌλ‘œ μœ„μΉ˜ 편ν–₯κ³Ό 같은 편ν–₯이 ν•¨κ»˜ μœ μž…λ˜λ―€λ‘œ λͺ¨λΈ ꡬ좕 μ‹œ 이λ₯Ό κ³ λ €ν•˜κ³  닀루어야 ν•˜λŠ” μ œμ•½ 사항이 λ”°λ¦…λ‹ˆλ‹€ [5, 6]. --- *Last updated: 2026-05-04*