Files
2nd/10_Wiki/Topics/AI_and_ML/Foundational LLM Concepts.md
T

5.1 KiB

id, title, category, status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, tags, raw_sources, last_reinforced, github_commit, inferred_by
id title category status canonical_id aliases duplicate_of source_trust_level confidence_score tags raw_sources last_reinforced github_commit inferred_by
wiki-2026-0508-foundational-llm-concepts Foundational LLM Concepts 10_Wiki/Topics needs_review self
none A 0.92
uncategorized
2026-05-08 pending Claude Opus 4.7 (auto-normalize 2026-05-08)

Foundational LLM Concepts (LLM 기초 개념)

📌 한 줄 통찰 (The Karpathy Summary)

Foundational LLM Concepts는 에이전틱 시스템의 두뇌 역할을 하는 대규모 언어 모델(LLM)의 본질적인 특성, 아키텍처적 한계, 그리고 에이전트 구축 시 고려해야 할 핵심 원리를 다룬다. 모델의 확률론적 특성과 컨텍스트 처리 방식에 대한 깊은 이해는 신뢰할 수 있는 에이전트 하네스를 설계하는 데 필수적인 기초 지식이다.

📖 구조화된 지식 (Synthesized Content)

  • LLM의 본질적 특성:
    • 확률론적 생성 (Probabilistic Generation): 다음 단어를 확률에 기반하여 선택하므로 동일한 입력에도 결과가 달라질 수 있는 비결정성(Non-determinism)을 가짐.
    • 컨텍스트 윈도우 (Context Window): 한 번에 처리할 수 있는 정보의 양이 제한되어 있으며, 이를 초과하면 이전 정보를 망각하거나 성능이 저하됨.
  • Long-context Models: 백만 토큰 이상의 방대한 컨텍스트를 지원하는 최신 모델들(Gemini 1.5, GPT-4o 등)의 특성과 에이전틱 워크플로우에 미치는 영향.
  • 비결정성 (Non-determinism) 제어: 확률적인 모델의 출력을 시스템적으로 통제하기 위해 온도(Temperature) 조절, Top-p 설정, 그리고 하네스 계층의 결정론적 검증 게이트를 활용하는 기법.
  • 토큰 경제학 (Token Economics): 입력과 출력 토큰의 비용과 추론 속도(Latency) 사이의 트레이드오프를 최적화하여 경제적인 시스템 구축.
  • 모델 정렬 (Alignment): 모델이 인간의 의도와 가치관에 부합하도록 학습(RLHF 등)된 정도와, 이것이 에이전트의 지시 준수 능력에 미치는 영향.

⚠️ 모순 및 업데이트 (Contradictions & Updates)

  • 추론 성능 vs 속도: 모델의 크기가 커질수록 지능은 높아지지만 반응 속도는 느려지고 비용은 증가한다.
  • 컨텍스트 크기 vs 집중력: 컨텍스트 윈도우가 커져도 모델이 중간에 위치한 정보에 소홀해지는 'Lost in the Middle' 현상은 여전히 존재할 수 있다.
  • 창의성 vs 신뢰성: 모델의 자유도를 높이면 창의적인 해결책이 나오지만, 동시에 환각(Hallucination)과 오류의 위험도 함께 증가한다.

🔗 지식 연결 (Graph)

  • Reasoning & Planning
    • 연결 이유: LLM의 기초적인 추론 능력을 바탕으로 복잡한 계획 수립 능력이 구축된다.
  • Context Engineering
    • 연결 이유: LLM의 컨텍스트 윈도우 한계를 기술적으로 극복하기 위한 방법론이다.
  • Agentic AI Security
    • 연결 이유: LLM의 취약점(인젝션 등)을 방어하는 보안 체계와 직결된다.

Deeper Research Questions

  • 모델의 '파라미터 지식'과 '컨텍스트 지식'이 에이전트의 최종 판단에서 각각 어느 정도의 비중을 차지하는지 정량적으로 측정할 수 있는가?
  • 특정 도메인(코딩, 법률, 의료)에 특화된 소형 모델(SLM)이 대형 모델(LLM)보다 에이전트 하네스 내부에서 더 효율적으로 작동할 수 있는 조건은 무엇인가?
  • 모델의 비결정성을 역으로 활용하여, 여러 번의 독립적인 추론을 수행하고 합의를 도출하는 '앙상블 추론'의 효과는 어떠한가?

Practical Application Contexts

  • Implementation: 작업의 난이도에 따라 저렴하고 빠른 모델(GPT-4o mini)과 강력하지만 비싼 모델(Claude 3.5 Sonnet)을 혼합하여 사용하는 하이브리드 모델 아키텍처를 설계한다.
  • System Design: 에이전트의 답변 일관성을 높이기 위해 seed 값을 고정하거나, 중요한 로직에서는 temperature=0으로 설정하여 결정론적 답변을 유도한다.

Last updated: 2026-05-01

🤖 LLM 활용 힌트 (How to Use This Knowledge)

언제 이 지식을 쓰는가:

  • (TODO)

언제 쓰면 안 되는가:

  • (TODO)

🧪 검증 상태 (Validation)

  • 정보 상태: needs_review
  • 출처 신뢰도: A
  • 검토 이유: (P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)

🧬 중복 검사 (Duplicate Check)

  • 기존 유사 문서: (TODO: 인덱서 클러스터 리포트 참조)
  • 처리 방식: UPDATE (자동 정규화)
  • 처리 이유: Phase 1 정규화 — 옛 템플릿/누락 필드 보강.

🕓 변경 이력 (Changelog)

날짜 변경 내용 처리 방식 신뢰도
2026-05-08 P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) UPDATE A