Files
2nd/10_Wiki/Topics/AI_and_ML/Miscellaneous_AI_Topics.md
T
Antigravity Agent f8b21af4be Wiki cleanup: error-doc removal, dedup merge, link normalization
10_Wiki/Topics 대규모 정리:
- 오류 캡처/미완성 stub 문서 227개 제거
- 교차폴더 중복 43클러스터 병합 (63파일 → redirect)
- 링크명 정규화: 깨진 링크 수정·redirect 직결·개념 매핑 ~2,400건
- 카테고리 MOC 6개 신규 생성
- Graph 섹션 미해결 related-keyword 링크 10,058건 제거

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-20 23:52:15 +09:00

5.1 KiB

id, title, status, canonical_id, aliases, duplicate_of, source_trust_level, confidence_score, verification_status, tags, raw_sources, last_reinforced, github_commit, tech_stack
id title status canonical_id aliases duplicate_of source_trust_level confidence_score verification_status tags raw_sources last_reinforced github_commit tech_stack
wiki-2026-0508-miscellaneous-ai-topics Miscellaneous AI Topics verified wiki-2026-0508-miscellaneous-ai-topics
Misc AI
AI Catch-all
AI Grab Bag
none A 0.85 applied
meta
index
ai
catch-all
niche
2026-05-10 pending

Miscellaneous AI Topics

한 줄 정의

주류 카테고리(NLP·CV·RL·LLM)에 깔끔히 들어가지 않지만 실무에서 자주 마주치는 틈새 AI 주제 모음. 정식 페이지가 생기기 전 임시 정착지이자, 단독 페이지로 키우기에는 작은 개념의 집결지.

핵심

자주 누락되는 영역

  • Causal Inference + ML: do-calculus, double ML, uplift modeling.
  • Differential Privacy in ML: DP-SGD, ε-budget, federated 결합.
  • Active Learning: label cost 최소화, uncertainty/diversity sampling.
  • Curriculum Learning: easy → hard 순서 학습.
  • Continual / Lifelong Learning: catastrophic forgetting, EWC, replay.
  • Meta-Learning: MAML, Reptile, in-context learning과의 관계.
  • AutoML 주변: NAS, HPO, AutoFE.
  • Tabular Deep Learning: TabNet, FT-Transformer, GBM 비교.
  • Time Series Foundation Models: TimesFM, Chronos, Moirai.
  • Symbolic + Neural: neuro-symbolic, program synthesis.

응용

연구 trend 추적, 단독 페이지 승격 후보 판별, onboarding 시 "이런 것도 있다" 한 장 인덱스.

💻 패턴

Active Learning loop

def active_learning_loop(model, pool_X, oracle, budget=1000, batch=20):
    labeled_X, labeled_y = [], []
    while len(labeled_y) < budget:
        probs = model.predict_proba(pool_X)
        # least confidence
        uncertainty = 1 - probs.max(axis=1)
        idx = uncertainty.argsort()[-batch:]
        x_new = pool_X[idx]
        y_new = oracle(x_new)
        labeled_X.extend(x_new); labeled_y.extend(y_new)
        pool_X = np.delete(pool_X, idx, axis=0)
        model.fit(labeled_X, labeled_y)
    return model

EWC (Elastic Weight Consolidation) 핵심

def ewc_loss(model, task_loss, fisher, theta_star, lam=1000):
    penalty = 0.0
    for n, p in model.named_parameters():
        if n in fisher:
            penalty += (fisher[n] * (p - theta_star[n])**2).sum()
    return task_loss + lam * penalty

MAML inner step (개념)

def maml_step(model, loss_fn, x_s, y_s, x_q, y_q, lr=0.01):
    grads = torch.autograd.grad(loss_fn(model(x_s), y_s),
                                model.parameters(), create_graph=True)
    fast_weights = [p - lr * g for p, g in zip(model.parameters(), grads)]
    # query loss with fast weights
    return functional_forward(model, fast_weights, x_q, y_q, loss_fn)

DP-SGD 노이즈 추가

# opacus 사용 예시
from opacus import PrivacyEngine
engine = PrivacyEngine()
model, optim, loader = engine.make_private(
    module=model, optimizer=optim, data_loader=loader,
    noise_multiplier=1.1, max_grad_norm=1.0,
)

Uplift Tree (causal ML)

from causalml.inference.tree import UpliftTreeClassifier
uplift = UpliftTreeClassifier(control_name='control')
uplift.fit(X, treatment=t_arr, y=y_arr)
te = uplift.predict(X_test)  # treatment effect per row

결정 기준

주제 단독 페이지로 분리할 시점
4회 이상 다른 페이지에서 링크 분리
코드 예시 5개 이상 누적 분리
결정 기준 표가 만들어짐 분리
단순 용어 정의 1줄 misc 유지
트렌드성 짧은 수명 misc 유지

기본값: 링크 4회 또는 250+ 라인 작성 가능 시 단독 분리.

🔗 Graph

🤖 LLM 활용

언제: 새 trend 키워드 등장 시 misc에 1줄 추가, 단독 분리 여부 판정 (링크 횟수 grep), 카테고리 재배치 brainstorm.

언제 X: 핵심 개념을 misc에서 영구히 유지 (단독 페이지로 승격해야 graph 확장 가능). 정의 정확도가 낮은 LLM 답변을 그대로 commit.

안티패턴

  • 모든 새 개념을 misc에 던져서 영구 방치 → 위키가 "잡동사니 폴더화".
  • 단독 페이지로 분리하지 않은 채 misc 페이지가 1000+ 라인으로 비대해짐.
  • 정식 카테고리(NLP/CV/RL)에 들어가야 할 주제를 misc에 잘못 배치.
  • Frontmatter tags가 너무 광범위해 검색 변별력 상실.

🧪 검증 / 중복

Verified source: Papers With Code 카테고리 트리, NeurIPS/ICML 워크숍 트랙, ML reading list (e.g., d2l.ai, Papers With Code SOTA). 신뢰도 A.

본 페이지는 메타/카테고리 인덱스로, 다른 페이지와 중복 아님.

🕓 Changelog

  • 2026-05-08 Phase 1 — 초기 stub.
  • 2026-05-10 Manual cleanup — FULL meta-index 형태로 재작성. 분리 기준표·코드 5종(active/EWC/MAML/DP-SGD/uplift) 추가.