Files
2nd/10_Wiki/Topics/Large Language Models (LLM).md
T
2026-05-02 23:33:34 +09:00

2.3 KiB


id: P-Reinforce-AUTO-LLMM-001 category: Unified confidence_score: 0.99 tags: [auto-reinforced, llm, large-Language-Models, Generative-AI, Foundation-Models, transformer] last_reinforced: 2026-04-20

Large Language Models (LLM)

📌 한 줄 통찰 (The Karpathy Summary)

"인류 지식의 거대 압축기: 전 지구적 텍스트 데이터를 학습하여 언어의 패턴을 완벽히 흡수하고, 다음 단어를 예측하는 단순한 행위로부터 추론, 요약, 번역, 코딩이라는 초월적 지능을 발현시키는 지식의 빅뱅."

📖 구조화된 지식 (Synthesized Content)

거대 언어 모델(LLM)은 수십억 개 이상의 파라미터를 가진 신경망 기반 언어 모델입니다. (Transformer 아키텍처 기반)

  1. 핵심 역량:
    • Context Learning: 주어진 문맥만으로 새로운 작업을 수행 (Few-Shot-Learning).
    • Emergent Abilities: 모델 규모가 일정 수준을 넘어서며 갑자기 발현되는 고차원 추론 능력. (Emergence와 연결)
    • Generality: 특정 용도가 아닌, 거의 모든 지적 작업에 범용적으로 사용 가능.
  2. 왜 중요한가?:
    • 인간과 기계의 소통 방식(HCI)을 근본적으로 바꾸었으며, 모든 소프트웨어의 '두뇌' 역할을 수행하는 중임. (Gen-AI의 주 엔진)

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 과거 언어 모델 정책은 단순 단어 나열 정책이었으나, LLM 정책은 언어 속에 담긴 '논리와 법칙 정책'을 이해하는 인지 모델로 진화함(RL Update).
  • 정책 변화(RL Update): 단순히 모델을 키우는 '물량 공세 정책'을 넘어, 적은 데이터와 파라미터로도 효율적인 성능을 내는 '소규모 거대 언어 모델(sLLM) 정책'과 실시간 검색을 결합한 'RAG 정책'으로 실무 정책이 이동 중임.

🔗 지식 연결 (Graph)