Files
2nd/10_Wiki/Topics/AI/Foundation-Models.md
T

2.3 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
P-REINFORCE-AUTO-FOMO-001 10_Wiki/💡 Topics/AI 0.98
auto-reinforced
foundation-models
llm
multimodal
generative-ai
scaling-laws
2026-04-20

Foundation-Models

📌 한 줄 통찰 (The Karpathy Summary)

"지능의 새로운 지층: 거대한 데이터셋에서 학습되어 언어, 이미지, 코딩 등 수많은 하위 작업을 동시에 수행할 수 있는 범용적인 능력을 갖춘 기본 모델로, 그 위에 다양한 앱이 건축(Fine-tuning)되는 현대 AI 생태계의 단단한 지반."

📖 구조화된 지식 (Synthesized Content)

파운데이션 모델(Foundation-Models)은 방대한 데이터에서 자기지도 학습(Self-supervised learning)을 통해 훈련되어 광범위한 하위 작업에 적응할 수 있는 모델입니다. (스탠포드 HAI 명명)

  1. 특징:
    • Generality: 특정 용도가 아닌 범용적 지능 제공.
    • Scale: 수천억 개의 파라미터와 테라바이트급 데이터로 학습.
    • Emergence: 학습하지 않은 능력(추론 등)이 규모가 커지며 갑자기 나타남. (Emergence와 연결)
    • Multimodality: 최근에는 텍스트를 넘어 시각, 청각을 동시에 처리.
  2. 왜 중요한가?:
    • 누구나 바닥부터 모델을 만들 필요 없이, 강력한 파운데이션 모델을 API나 오픈소스로 가져와 비즈니스 아이디어만 얹으면 되는 'AI 민주화'의 핵심임.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거에는 각 도메인별로 전용 모델을 만드는 '개별 최적화 정책'이었으나, 현대 정책은 하나의 거대 모델이 모든 것을 더 잘한다는 '범용 엔진 정책(One-model-to-rule-them-all)'으로 시장이 재편됨(RL Update).
  • 정책 변화(RL Update): 단일 거대 모델의 효율 정책 한계를 극복하기 위해, 특정 영역에 특화된 여러 소형 모델을 연결하는 '에이전틱 워크플로우 정책'이나 'Mixture of Experts(MoE) 정책'으로 기술이 분화 중임.

🔗 지식 연결 (Graph)