Files
2nd/10_Wiki/Topics_Blog/Online-Learning-and-Streaming.md
T

2.5 KiB

id, category, confidence_score, tags, last_reinforced
id category confidence_score tags last_reinforced
ML-ONLINE-001 10_Wiki/💡 Topics/AI 1.0
machine-learning
online-learning
streaming-data
incremental-learning
real-time-ai
mlops
2026-04-26

Online Learning and Streaming (온라인 학습과 스트리밍)

📌 한 줄 통찰 (The Karpathy Summary)

"데이터의 유효기간이 지나기 전에 학습하고, 멈추지 않는 정보의 강물(Stream) 위에서 지능을 실시간으로 진화시켜라" — 대규모 데이터를 한꺼번에 처리하는 대신, 순차적으로 들어오는 데이터 샘플이나 미니 배치를 즉시 모델에 반영하여 최신 상태를 유지하는 학습 패러다임.

📖 구조화된 지식 (Synthesized Content)

  • 추출된 패턴: "Sequential Update and Concept Drift Adaptation" — 모델 전체를 다시 학습시키는 비용을 들이지 않고, 새로운 데이터가 들어올 때마다 가중치를 조금씩 수정(Incremental Update)함으로써 급변하는 데이터 분포(Concept Drift)에 즉각적으로 대응하는 패턴.
  • 핵심 기술:
    • Stochastic Gradient Descent (SGD): 한 번에 하나의 샘플로 가중치를 업데이트하는 온라인 학습의 기본 최적화 도구.
    • Sliding Window: 최신 데이터에 더 높은 비중을 두고 과거 데이터를 점진적으로 망각.
    • Stream Processing (Kafka, Flink): 대규모 데이터 스트림을 저지연으로 수집하고 처리하는 인프라.
  • 의의: 서버 자원이 한정적이거나 데이터가 너무 커서 전체를 저장할 수 없는 경우, 그리고 실시간 추천이나 이상 탐지처럼 '지금 당장'의 판단이 중요한 분야의 필수 기술.

⚠️ 모순 및 업데이트 (Contradictions & RL Update)

  • 과거 데이터와의 충돌: 온라인 학습은 데이터 노이즈에 너무 민감하게 반응하여 학습이 요동칠 수 있다는 문제가 있었으나, 최근에는 안정적인 모멘텀 기법과 모델 평균화(Model Averaging)를 통해 실전에서도 높은 견고함을 확보함.
  • 정책 변화: Antigravity 프로젝트는 에이전트의 사용자 개인화 프로필 업데이트 시, 전체 재학습 대신 온라인 학습 기법을 적용하여 사용자의 최신 선호도를 즉각 반영함.

🔗 지식 연결 (Graph)