bluemsi/2nd

Files

T

bluemsi ae1627c35b feat: achieve 600 files milestone in AI knowledge base

2026-04-20 19:23:51 +09:00

2.3 KiB

Raw Blame History

id, category, confidence_score, tags, last_reinforced

id

category

confidence_score

tags

last_reinforced

P-REINFORCE-AUTO-BERT-001

10_Wiki/💡 Topics/AI

1.00

auto-reinforced

bert

nlp

transformers

language-models

pre-training

2026-04-20

BERT

📌 한 줄 통찰 (The Karpathy Summary)

"양방향 문맥의 혁명: 문장을 앞뒤로 번갈아 훑어가며 보이지 않는 구멍(Mask)을 채워 넣는 훈련을 통해, 단어 하나가 문장 전체와 맺는 깊은 의미적 맥락을 완벽히 이해해낸 구글의 언어 지성체."

📖 구조화된 지식 (Synthesized Content)

BERT(Bidirectional Encoder Representations from Transformers)는 2018년 구글이 공개한 트랜스포머 기반의 사전 학습(Pre-training) 모델입니다.

핵심 혁신 - 양방향성(Bidirectionality):
- 이전 모델들이 문장을 한 방향으로만 읽었던 것과 달리, BERT는 문장 전체를 한꺼번에 보고 각 단어의 앞뒤 문맥을 동시에 파악함.
학습 전략:
- MLM (Masked Language Model): 문장 일부 단어를 가리고 원본을 맞추게 함. (Auto-Encoding의 변형)
- NSP (Next Sentence Prediction): 두 문장이 연달아 이어지는 문장인지 판별함.
영향:
- 검색 엔진(Google Search)의 의미 이해도를 비약적으로 높였으며, 수많은 후속 모델(RoBERTa, ALBERT 등)의 시조가 됨.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

과거 데이터와의 충돌: 과거에는 특정 태스크마다 모델을 새로 만드는 정책이었으나, BERT 이후로는 거대 모델을 먼저 범용적으로 학습시키고 개별 태스크에 미세 조정(Fine-tuning)하는 'Pre-train & Fine-tune 정책'이 표준이 됨(RL Update).
정책 변화(RL Update): 최근에는 BERT와 같은 인코더 전용 모델보다 긴 문장을 생성하는 디코더 전용 모델(GPT 시리즈)에 연구 역량이 집중되는 정책적 변화가 있었으나, 정밀한 텍스트 분석 및 정보 추출 분야에서는 여전히 BERT 계열 모델이 실무적 불패 정책을 유지함.

🔗 지식 연결 (Graph)

Transformers, Natural Language Processing (NLP), Auto-Encoding, Word-Representation, Attention Mechanisms
Modern Tech/Tools: Hugging Face Transformers library, BERT-Large, DistilBERT.