2.3 KiB
2.3 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | ||||||
|---|---|---|---|---|---|---|---|---|---|---|
| P-REINFORCE-AUTO-BERT-001 | 10_Wiki/💡 Topics/AI | 1.00 |
|
2026-04-20 |
BERT
📌 한 줄 통찰 (The Karpathy Summary)
"양방향 문맥의 혁명: 문장을 앞뒤로 번갈아 훑어가며 보이지 않는 구멍(Mask)을 채워 넣는 훈련을 통해, 단어 하나가 문장 전체와 맺는 깊은 의미적 맥락을 완벽히 이해해낸 구글의 언어 지성체."
📖 구조화된 지식 (Synthesized Content)
BERT(Bidirectional Encoder Representations from Transformers)는 2018년 구글이 공개한 트랜스포머 기반의 사전 학습(Pre-training) 모델입니다.
- 핵심 혁신 - 양방향성(Bidirectionality):
- 이전 모델들이 문장을 한 방향으로만 읽었던 것과 달리, BERT는 문장 전체를 한꺼번에 보고 각 단어의 앞뒤 문맥을 동시에 파악함.
- 학습 전략:
- MLM (Masked Language Model): 문장 일부 단어를 가리고 원본을 맞추게 함. (Auto-Encoding의 변형)
- NSP (Next Sentence Prediction): 두 문장이 연달아 이어지는 문장인지 판별함.
- 영향:
- 검색 엔진(Google Search)의 의미 이해도를 비약적으로 높였으며, 수많은 후속 모델(RoBERTa, ALBERT 등)의 시조가 됨.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 과거에는 특정 태스크마다 모델을 새로 만드는 정책이었으나, BERT 이후로는 거대 모델을 먼저 범용적으로 학습시키고 개별 태스크에 미세 조정(Fine-tuning)하는 'Pre-train & Fine-tune 정책'이 표준이 됨(RL Update).
- 정책 변화(RL Update): 최근에는 BERT와 같은 인코더 전용 모델보다 긴 문장을 생성하는 디코더 전용 모델(GPT 시리즈)에 연구 역량이 집중되는 정책적 변화가 있었으나, 정밀한 텍스트 분석 및 정보 추출 분야에서는 여전히 BERT 계열 모델이 실무적 불패 정책을 유지함.
🔗 지식 연결 (Graph)
- Transformers, Natural Language Processing (NLP), Auto-Encoding, Word-Representation, Attention Mechanisms
- Modern Tech/Tools: Hugging Face Transformers library, BERT-Large, DistilBERT.