Files
2nd/10_Wiki/Topics/Foundation-Models.md
T
2026-05-02 23:33:34 +09:00

33 lines
2.4 KiB
Markdown

---
id: [[P-Reinforce|P-Reinforce]]-AUTO-FOMO-001
category: Unified
confidence_score: 0.98
tags: [auto-reinforced, foundation-models, llm, multimodal, [[Generative-AI|Generative-AI]], scaling-laws]
last_reinforced: 2026-04-20
---
# [[Foundation-Models|Foundation-Models]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "지능의 새로운 지층: 거대한 데이터셋에서 학습되어 언어, 이미지, 코딩 등 수많은 하위 작업을 동시에 수행할 수 있는 범용적인 능력을 갖춘 기본 모델로, 그 위에 다양한 앱이 건축([[Fine-tuning|Fine-tuning]])되는 현대 AI 생태계의 단단한 지반."
## 📖 구조화된 지식 (Synthesized Content)
파운데이션 모델(Foundation-Models)은 방대한 데이터에서 자기지도 학습(Self-supervised learning)을 통해 훈련되어 광범위한 하위 작업에 적응할 수 있는 모델입니다. (스탠포드 HAI 명명)
1. **특징**:
* **Generality**: 특정 용도가 아닌 범용적 지능 제공.
* **Scale**: 수천억 개의 파라미터와 테라바이트급 데이터로 학습.
* **[[Emergence|Emergence]]**: 학습하지 않은 능력(추론 등)이 규모가 커지며 갑자기 나타남. (Emergence와 연결)
* **Multimodality**: 최근에는 텍스트를 넘어 시각, 청각을 동시에 처리.
2. **왜 중요한가?**:
* 누구나 바닥부터 모델을 만들 필요 없이, 강력한 파운데이션 모델을 API나 오픈소스로 가져와 비즈니스 아이디어만 얹으면 되는 'AI 민주화'의 핵심임.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌**: 과거에는 각 도메인별로 전용 모델을 만드는 '개별 최적화 정책'이었으나, 현대 정책은 하나의 거대 모델이 모든 것을 더 잘한다는 '범용 엔진 정책(One-model-to-rule-them-all)'으로 시장이 재편됨(RL Update).
- **정책 변화(RL Update)**: 단일 거대 모델의 효율 정책 한계를 극복하기 위해, 특정 영역에 특화된 여러 소형 모델을 연결하는 '에이전틱 워크플로우 정책'이나 'Mixture of Experts(MoE) 정책'으로 기술이 분화 중임.
## 🔗 지식 연결 (Graph)
- [[Gen-AI|Gen-AI]], [[Emergence|Emergence]], [[Fine-tuning|Fine-tuning]], Multi-modal (멀티모달), Scaling-Laws
- **Modern Tech/Tools**: GPT-4, Llama-3, Claude 3, Gemini, ViT (Vision Transformer).
---