# [[BERT]] ## πŸ“Œ Brief Summary BERT(Bidirectional Encoder Representations from Transformers)λŠ” 2019λ…„ ꡬ글(Google)이 λ„μž…ν•œ 신경망 기반의 μžμ—°μ–΄ 처리(NLP) κΈ°μˆ μž…λ‹ˆλ‹€ [1]. λ¬Έμž₯ λ‚΄ νŠΉμ • λ‹¨μ–΄μ˜ μ•žλ’€ λ¬Έλ§₯을 λͺ¨λ‘ λΆ„μ„ν•˜μ—¬ 단어 κ°„μ˜ 관계와 μˆ¨κ²¨μ§„ 의미λ₯Ό μ •ν™•ν•˜κ²Œ νŒŒμ•…ν•˜λŠ” 것이 νŠΉμ§•μž…λ‹ˆλ‹€ [1]. λ‹¨μˆœν•œ ν‚€μ›Œλ“œ 일치λ₯Ό λ„˜μ–΄ μ‚¬μš©μžμ˜ 검색 μ˜λ„λ₯Ό μ΄ν•΄ν•˜λŠ” 의미둠적 검색(Semantic Search)κ³Ό 벑터 검색(Vector Search)을 κ³ λ„ν™”ν•˜λŠ” 핡심 μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œ ν™œμš©λ˜κ³  μžˆμŠ΅λ‹ˆλ‹€ [2-4]. ## πŸ“– Core Content * **μžμ—°μ–΄ 처리 및 λ¬Έλ§₯ μ΄ν•΄μ˜ ν˜μ‹ :** BERTλŠ” λ¬Έμž₯ λ‚΄μ—μ„œ λ‹¨μ–΄μ˜ μ•žλ’€ μœ„μΉ˜λ₯Ό λͺ¨λ‘ μ‚΄νŽ΄λ³΄λ©° λ¬Έλ§₯을 μ–‘λ°©ν–₯으둜 νŒŒμ•…ν•©λ‹ˆλ‹€ [1]. 이λ₯Ό 톡해 λŒ€ν™”ν˜•μ΄κ±°λ‚˜ λ³΅μž‘ν•œ κ²€μƒ‰μ–΄μ˜ 의미λ₯Ό μ •ν™•νžˆ 이해할 수 있으며, 예λ₯Ό λ“€μ–΄ μ‚¬μš©μžκ°€ 무언가λ₯Ό κ³ μΉ˜λŠ” 방법을 검색할 λ•Œ '직접(yourself)'μ΄λΌλŠ” 단어가 질의의 μ˜λ„λ₯Ό κ²°μ •ν•˜λŠ” 데 ν•΅μ‹¬μ μ΄λΌλŠ” 점을 νŒŒμ•…ν•˜μ—¬ μ μ ˆν•œ κ²°κ³Όλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€ [5]. * **벑터 μž„λ² λ”© 생성:** κ°œλ°œμžλ“€μ€ BERT와 같은 사전 ν•™μŠ΅λœ λͺ¨λΈ(Pre-trained models)을 μ‚¬μš©ν•˜μ—¬ λ¬Έμ„œλ‚˜ 질의λ₯Ό 고차원 κ³΅κ°„μ˜ 벑터(μž„λ² λ”©)둜 λ³€ν™˜ν•©λ‹ˆλ‹€ [6]. λ³€ν™˜λœ 벑터듀은 코사인 μœ μ‚¬λ„(Cosine similarity)λ‚˜ μœ ν΄λ¦¬λ“œ 거리(Euclidean distance) 등을 톡해 μ§ˆμ˜μ™€ 의미적으둜 κ°€μž₯ μœ μ‚¬ν•œ λ¬Έμ„œλ₯Ό μƒ‰μΈν•˜κ³  κ²€μƒ‰ν•˜λŠ” 데 μ‚¬μš©λ©λ‹ˆλ‹€ [6]. * **λ‘±ν…ŒμΌ ν‚€μ›Œλ“œ(Long-tail Keywords) 처리 ν–₯상:** BERTλŠ” κΈΈκ³  ꡬ체적인 문ꡬ둜 이루어진 λ‘±ν…ŒμΌ ν‚€μ›Œλ“œμ˜ 처리 방식을 크게 κ°œμ„ ν–ˆμŠ΅λ‹ˆλ‹€ [5]. μžμ—°μŠ€λŸ¬μš΄ λŒ€ν™”ν˜• 쿼리λ₯Ό 더 잘 해석할 수 있게 λ˜μ–΄ μ‚¬μš©μžμ—κ²Œ λ”μš± κ΄€λ ¨μ„± 높은 κ²°κ³Όλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€ [5]. * **검색 μ—”μ§„ μ΅œμ ν™”(SEO) μ „λž΅μ˜ λ³€ν™”:** BERT와 랭크브레인(RankBrain) 같은 인곡지λŠ₯ 주도 λ„κ΅¬μ˜ λ„μž…μ€ SEO νŒ¨λŸ¬λ‹€μž„μ„ λ³€ν™”μ‹œμΌ°μŠ΅λ‹ˆλ‹€ [7, 8]. μ •ν™•νžˆ μΌμΉ˜ν•˜λŠ” ν‚€μ›Œλ“œ(Exact-match keywords)λ₯Ό μ±„μ›Œ λ„£λŠ” κΈ°μ‘΄ λ°©μ‹μ—μ„œ λ²—μ–΄λ‚˜, μ‚¬μš©μžμ˜ μ˜λ„λ₯Ό λ§Œμ‘±μ‹œν‚€λŠ” λ¬Έλ§₯상 κ΄€λ ¨μ„± λ†’κ³  ν’ˆμ§ˆμ΄ μš°μˆ˜ν•œ μ½˜ν…μΈ λ₯Ό μƒμ„±ν•˜λŠ” λ°©ν–₯으둜 SEO μ „λž΅μ΄ μž¬νŽΈλ˜μ—ˆμŠ΅λ‹ˆλ‹€ [8]. ## βš–οΈ Trade-offs & Caveats * **높은 μ»΄ν“¨νŒ… λ¦¬μ†ŒμŠ€ μš”κ΅¬ 및 λ³΅μž‘μ„±:** BERT와 같은 트랜슀포머(Transformer) 기반 λͺ¨λΈμ„ ν™œμš©ν•œ 의미둠적 벑터 검색은 λͺ¨λΈμ„ ν›ˆλ ¨ν•˜κ³  검색 μ‹œμŠ€ν…œμ„ κ΅¬ν˜„ν•˜λŠ” 과정이 λ³΅μž‘ν•©λ‹ˆλ‹€ [4, 9]. λ˜ν•œ, 기쑴의 전톡적인 ν‚€μ›Œλ“œ 검색(Lexical Search)에 λΉ„ν•΄ 훨씬 더 λ§Žμ€ μ»΄ν“¨νŒ… λ¦¬μ†ŒμŠ€μ™€ μ—°μ‚° λŠ₯λ ₯을 μš”κ΅¬ν•œλ‹€λŠ” 단점이 μžˆμŠ΅λ‹ˆλ‹€ [9-11]. * **μ •ν™•ν•œ μ–΄νœ˜ 맀칭의 ν•œκ³„:** λ¬Έλ§₯κ³Ό 의미λ₯Ό μ΄ν•΄ν•˜λŠ” λ°λŠ” νƒμ›”ν•˜μ§€λ§Œ, νŠΉμ • μ œν’ˆ μ½”λ“œ, 고유 λͺ…사, κ³ λ„μ˜ μ „λ¬Έ 기술 μš©μ–΄(jargon)와 같이 μ–΄νœ˜μ˜ μ •ν™•ν•œ μΌμΉ˜κ°€ ν•„μš”ν•œ κ²€μƒ‰μ—μ„œλŠ” κΈ°μ‘΄ ν‚€μ›Œλ“œ 검색보닀 μœ μš©μ„±μ΄ λ–¨μ–΄μ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€ [4, 9, 12]. * **ν•˜μ΄λΈŒλ¦¬λ“œ μ ‘κ·Όμ˜ ν•„μš”μ„±:** μœ„μ™€ 같은 ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄, μ‚°μ—…κ³„μ—μ„œλŠ” BERT 등을 ν™œμš©ν•œ 의미둠적 벑터 κ²€μƒ‰λ§Œ λ‹¨λ…μœΌλ‘œ μ‚¬μš©ν•˜κΈ°λ³΄λ‹€λŠ” μ •λ°€ν•œ ν‚€μ›Œλ“œ 맀칭을 κ²°ν•©ν•œ ν•˜μ΄λΈŒλ¦¬λ“œ 검색(Hybrid Search) λͺ¨λΈμ„ μ±„νƒν•˜μ—¬ 의미적 κΉŠμ΄μ™€ 정확성을 λ™μ‹œμ— ν™•λ³΄ν•˜λŠ” 방식을 ꢌμž₯ν•©λ‹ˆλ‹€ [11-15]. --- *Last updated: 2026-05-04*