chore(wiki): reinforce knowledge batch #13-#14 (280 docs milestone)
This commit is contained in:
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: SYS-IMP-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [system-design, engineering, impedance-matching, optimization, scalability]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Impedance Matching in Systems (시스템 임피던스 매칭)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "서로 다른 두 시스템이 만나는 경계에서 에너지와 데이터의 손실을 최소화하고, 흐름의 효율을 극대화하라" — 전기 회로의 개념을 소프트웨어 아키텍처로 확장하여, 서로 다른 처리 속도나 데이터 구조를 가진 컴포넌트 간의 결합을 최적화하는 설계 원리.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Interface Alignment" — 데이터를 생산하는 속도(Producer)와 소비하는 속도(Consumer), 또는 객체 지향 코드와 관계형 데이터베이스(ORM) 사이의 간극을 메우기 위해 버퍼, 캐시, 변환 레이어를 배치하는 조율 패턴.
|
||||
- **주요 적용 사례:**
|
||||
- **Software Engineering:** 비동기 메시지 큐(Kafka, RabbitMQ)를 통한 처리 속도 차이 조율.
|
||||
- **Database (ORM):** 객체 모델과 테이블 모델 간의 구조적 불일치 해결.
|
||||
- **API Design:** 프론트엔드가 요구하는 데이터 형태와 백엔드가 제공하는 데이터 형태 사이의 변환 (BFF - Backend For Frontend).
|
||||
- **의의:** 시스템 전체의 병목 현상을 방지하고, 구성 요소 간의 결합도(Coupling)를 낮추어 유지보수성과 확장성을 확보함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순히 연결만 하면 된다는 사고에서 벗어나, 연결 지점에서 발생하는 '에너지 손실(지연 시간, 리소스 낭비)'을 정량화하고 이를 최소화하는 것이 고성능 아키텍처의 핵심임을 인식.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 사고 속도와 UI 반영 속도 사이의 임피던스 매칭을 위해 '스트리밍 파싱'과 '상태 관리 최적화'를 필수 기술 표준으로 채택함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[System-Design-for-AI-Scale]], [[High-Availability-Systems]], [[Frontend-Architecture]], [[Message-Queues-and-Event-Streams]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Impedance-Matching.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: AI-INC-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, machine-learning, incremental-learning, lifelong-learning, online-learning]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Incremental Learning (증분 학습)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "과거의 지혜를 잊지 않으면서, 새로운 지식을 끊임없이 흡수하여 진화하는 지능을 구축하라" — 전체 데이터를 다시 학습하지 않고, 실시간으로 유입되는 새로운 데이터를 점진적으로 반영하여 모델을 업데이트하는 머신러닝 기법.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Streaming Intelligence" — 데이터의 흐름(Stream)을 따라 모델의 파라미터를 미세 조정하며, 새로운 지식을 추가할 때 발생하는 파괴적 망각(Catastrophic Forgetting)을 방지하는 지식 축적 패턴.
|
||||
- **핵심 과제 및 해결책:**
|
||||
- **Catastrophic Forgetting:** 새로운 학습이 기존 가중치를 덮어씌워 과거 지식을 잃어버리는 현상. -> 정규화(Regularization)나 리플레이(Replay) 버퍼를 통해 해결.
|
||||
- **Plasticity vs Stability:** 변화에 유연하면서도 본질적인 지식은 고수해야 하는 딜레마.
|
||||
- **Elastic Weight Consolidation (EWC):** 중요한 과거 지식에 관련된 가중치 변화에 벌점을 부여하여 보존.
|
||||
- **의의:** 데이터 규모가 기하급수적으로 커지는 환경에서 재학습 비용을 절감하고, 최신 트렌드를 즉각 반영하는 '살아있는 모델' 운영 가능.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 고정된 데이터셋(Static dataset) 학습이 주류였으나, 이제는 실시간으로 변화하는 도메인에 적응하는 '연속 학습(Continual Learning)'이 AI의 생존 필수 조건으로 부상함.
|
||||
- **정책 변화:** Antigravity 프로젝트는 매일 추가되는 수천 개의 새로운 위키 문서를 즉각적으로 반영하기 위해, 벡터 인덱스뿐만 아니라 경량화된 증분 학습 파이프라인을 운영 중임.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Reinforcement-Learning]], [[Transfer-Learning-Foundations]], [[Online-Learning-Algorithms]], [[Generalization-in-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Incremental-Learning.md]]
|
||||
@@ -0,0 +1,31 @@
|
||||
---
|
||||
id: MATH-ICA-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [statistics, machine-learning, ica, signal-processing, blind-source-separation]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Independent Component Analysis (ICA, 독립 성분 분석)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "뒤섞인 소음들 속에서 각기 다른 목소리의 본질을 찾아내어 분리하라" — 서로 독립적인 여러 신호가 혼합된 관측 데이터로부터, 통계적 독립성(Statistical Independence)을 최대화하는 방향으로 원래의 소스 신호들을 찾아내는 기법.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Blind Source Separation" — 믹싱 과정에 대한 사전 지식 없이도, 각 성분이 가우시안 분포가 아니며 서로 독립적이라는 가정을 통해 데이터의 숨겨진 원천을 분리하는 역행렬 추론 패턴.
|
||||
- **PCA와의 차이:**
|
||||
- **PCA (주성분 분석):** 데이터의 분산이 가장 큰 축(직교)을 찾음. 상관관계 제거에 집중.
|
||||
- **ICA:** 데이터가 통계적으로 가장 독립적인 축을 찾음. 실제 신호 분리에 집중.
|
||||
- **주요 활용 사례:**
|
||||
- **Cocktail Party Problem:** 시끄러운 파티장에서 특정 사람의 목소리만 분리.
|
||||
- **EEG/MEG:** 뇌 활동 신호에서 근육 움직임이나 눈 깜빡임 등의 잡음 제거.
|
||||
- **Finance:** 여러 경제 지표의 혼합 속에서 독립적인 시장 동인 파악.
|
||||
- **의의:** 관측된 현상 이면에 존재하는 독립적인 실체들을 규명함으로써 데이터의 진정한 의미를 파악하게 함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 선형 결합 모델의 한계를 넘어, 최근에는 신경망을 결합한 비선형 ICA를 통해 훨씬 복잡한 데이터의 독립 성분을 추출하는 방향으로 진화.
|
||||
- **정책 변화:** Antigravity 프로젝트는 다중 에이전트의 로그가 뒤섞인 통합 스트림에서 각 에이전트의 고유한 행동 패턴을 분리하여 분석하기 위해 ICA 기반의 시퀀스 분리 기술을 검토 중임.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Dimensionality-Reduction]], [[Probability-Theory]], [[Sequence-Modeling]], [[Digital-Signal-Processing-DSP]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Independent-Component-Analysis.md]]
|
||||
@@ -0,0 +1,29 @@
|
||||
---
|
||||
id: DATA-IDX-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [database, data-engineering, indexing, search-engine, vector-database, scalability]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Indexing Strategies (인덱싱 전략)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터를 무작정 쌓지 말고, 정교한 지도를 그려 검색의 비용을 최소화하라" — 방대한 데이터셋에서 특정 정보를 신속하게 찾기 위해 별도의 최적화된 자료구조(Index)를 구축하고 운영하는 기술 전략.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Space-Time Trade-off" — 추가적인 저장 공간(Index)을 사용하여 데이터 접근 시간(Search Time)을 획기적으로 단축시키는 효율성 극대화 패턴.
|
||||
- **주요 인덱싱 기법:**
|
||||
- **B-Tree / B+Tree:** 범위 검색에 강하며 대부분의 관계형 DB에서 표준으로 사용.
|
||||
- **Hash Index:** 정확한 키 일치 검색에서 최강의 성능($O(1)$)을 발휘.
|
||||
- **Inverted Index (역색인):** 텍스트 검색 엔진(Lucene, Elasticsearch)의 핵심. 단어가 포함된 문서를 즉시 추적.
|
||||
- **Vector Indexing (HNSW, IVFFlat):** AI의 임베딩 벡터 간 유사도를 빠르게 계산하기 위한 고차원 공간 인덱싱.
|
||||
- **의의:** 시스템의 규모가 커질수록 인덱싱 전략이 전체 아키텍처의 성능과 사용자 경험을 결정짓는 핵심 요소가 됨.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 정적인 텍스트 인덱싱 중심에서, 이제는 의미론적 검색을 위한 벡터 인덱싱과 실시간 업데이트가 가능한 동적 인덱싱이 AI 시스템의 필수 조건으로 부상함.
|
||||
- **정책 변화:** Antigravity 프로젝트는 1,174개의 위키 문서와 수만 개의 로우 데이터를 연결하기 위해, 역색인(키워드)과 벡터 인덱스(의미)를 결합한 하이브리드 인덱싱 전략을 사용하여 검색의 정확도와 속도를 동시에 확보함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Hash-Functions-and-Maps]], [[Vector-Database-Foundations]], [[System-Design-for-AI-Scale]], [[Search-Algorithms]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Indexing-Strategies.md]]
|
||||
@@ -0,0 +1,29 @@
|
||||
---
|
||||
id: AI-BIAS-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, machine-learning, inductive-bias, neural-networks, generalization]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Inductive Bias (귀납적 편향)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "무엇이든 배울 수 있는 유연함보다, 세상의 규칙을 미리 가정하는 영리함이 더 빠른 지능을 만든다" — 학습 알고리즘이 훈련 데이터 이외의 새로운 상황에 직면했을 때, 정답을 추론하기 위해 사용하는 일련의 사전 가정(Assumptions).
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Occam's Razor" — 복잡한 설명보다 단순한 규칙이 더 정답일 확률이 높다는 가정 하에, 모델 아키텍처 자체에 특정 도메인의 물리적/논리적 특성을 내재시키는 설계 패턴.
|
||||
- **주요 아키텍처별 귀납적 편향:**
|
||||
- **CNN:** 지역성(Locality)과 이동 불변성(Translation Invariance). "가까운 픽셀은 관계가 깊고, 위치가 바뀌어도 같은 사물이다."
|
||||
- **RNN:** 순차적 의존성(Sequential Dependency). "현재는 과거의 상태에 영향을 받는다."
|
||||
- **GNN:** 위상적 관계(Relational Bias). "연결된 노드들 사이에 정보가 흐른다."
|
||||
- **Transformer:** 매우 낮은 귀납적 편향. 대규모 데이터를 통해 스스로 규칙을 찾도록 설계됨 (전역적 어텐션).
|
||||
- **의의:** 적절한 귀납적 편향은 데이터가 적을 때 학습 효율을 극대화하고 오버피팅을 방지하지만, 너무 강하면 새로운 패턴 학습을 방해할 수 있음.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 사람이 정교한 편향(Hand-crafted features)을 넣어주던 방식에서, 이제는 편향이 적은 모델(Transformer)에 거대한 데이터를 쏟아부어 모델이 스스로 최적의 편향을 학습하게 하는 'Bitter Lesson' 패러다임으로 전환 중.
|
||||
- **정책 변화:** Antigravity 프로젝트는 도메인 특화 에이전트 설계 시, 초기 학습 속도를 높이기 위해 도메인 지식 기반의 강한 귀납적 편향을 아키텍처에 반영함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Generalization-in-AI]], [[Deep-Learning-Foundations]], [[CNN-Mastery]], [[Transformer-Architecture-Foundations]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Inductive-Bias.md]]
|
||||
@@ -0,0 +1,30 @@
|
||||
---
|
||||
id: AI-INF-OPT-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, deep-learning, inference, optimization, quantization, model-serving]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Inference Optimization (추론 최적화)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "모델의 지능은 유지하되, 실행 비용과 지연 시간(Latency)은 극한으로 깎아내어 실전 배치 능력을 확보하라" — 학습된 모델을 실제 서비스 환경에서 더 빠르고 가볍게 구동하기 위해 모델 구조와 연산 방식을 최적화하는 기술.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Lightweight Intelligence" — 모델의 파라미터 중 중요도가 낮은 부분을 제거하거나 정밀도를 낮추어, 하드웨어 자원을 덜 쓰면서도 유사한 성능을 내게 하는 효율성 극대화 패턴.
|
||||
- **주요 최적화 기법:**
|
||||
- **Quantization (양자화):** FP32 가중치를 INT8 등으로 변환하여 메모리 사용량과 연산 속도 개선.
|
||||
- **Pruning (가지치기):** 성능에 영향이 적은 뉴런이나 연결(Weights)을 제거하여 모델 경량화.
|
||||
- **Knowledge Distillation (지식 증류):** 거대 모델(Teacher)의 지식을 작은 모델(Student)에게 전수.
|
||||
- **Operator Fusion:** 여러 연산을 하나로 합쳐 메모리 접근 횟수 감소.
|
||||
- **Caching:** 트랜스포머의 KV Cache 등 반복 연산 결과 재사용.
|
||||
- **의의:** AI 모델이 연구실을 넘어 모바일 기기나 실시간 응답이 필요한 대규모 서비스에 적용될 수 있게 하는 핵심 동력.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 모델이 클수록 무조건 좋다는 믿음에서 벗어나, 이제는 주어진 자원(Budget) 내에서 최적의 성능을 내는 '비율 효율적 지능'이 산업계의 표준으로 자리 잡음.
|
||||
- **정책 변화:** Antigravity 프로젝트는 로컬 브레인 구동 시 가용 VRAM 용량에 따라 모델을 4-bit 또는 8-bit로 동적 양자화하여, 저사양 기기에서도 초저지연 응답을 보장함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Hardware-Acceleration-for-AI]], [[GPU-Architecture-for-AI]], [[System-Design-for-AI-Scale]], [[LLM]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Inference-Optimization.md]]
|
||||
@@ -0,0 +1,29 @@
|
||||
---
|
||||
id: DATA-IR-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [data-science, information-retrieval, search-engine, ranking, nlp, rag]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Information Retrieval (IR, 정보 검색)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터의 바다에서 단순한 키워드가 아닌, 사용자의 질문과 가장 밀접한 '의미의 정수'를 건져 올려라" — 비정형 데이터셋에서 사용자의 정보 요구(Query)에 부합하는 유효한 정보를 찾아내고, 관련성(Relevance)에 따라 순위를 매겨 제공하는 학문 및 기술.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Retrieve and Rank" — 1단계에서 대량의 데이터 중 후보군을 빠르게 추출(Retrieval)하고, 2단계에서 정교한 모델을 통해 최적의 순서를 결정(Ranking)하는 단계적 필터링 패턴.
|
||||
- **핵심 모델:**
|
||||
- **Boolean Model:** 키워드의 존재 여부만 판단 (고전적 방식).
|
||||
- **Vector Space Model (TF-IDF, BM25):** 단어 빈도와 희소성을 바탕으로 문서의 중요도 계산.
|
||||
- **Neural IR (Dense Retrieval):** 임베딩 벡터 간 유사도를 통해 의미론적 검색 수행 (현대적 방식).
|
||||
- **평가 지표:** Precision, Recall, F1-Score, 그리고 순위의 정확도를 측정하는 MRR, nDCG 등.
|
||||
- **의의:** AI 에이전트가 외부 지식을 활용하는 RAG(Retrieval-Augmented Generation) 시스템의 성능을 결정짓는 가장 중요한 인프라.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순 키워드 매칭 중심에서, 이제는 사용자의 질문 맥락을 이해하는 시맨틱 검색(Semantic Search)과 하이브리드 검색(키워드+의미)이 검색 품질의 표준이 됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 1,174개의 위키 문서 검색 시 BM25와 Dense Vector 검색을 앙상블한 하이브리드 IR 시스템을 사용하여 지식 탐색의 정확도를 극대화함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Indexing-Strategies]], [[Vector-Database-Foundations]], [[NLP-Foundations]], [[Hallucination-in-LLMs]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Information-Retrieval-IR.md]]
|
||||
@@ -1,28 +1,31 @@
|
||||
---
|
||||
id: IAC-001
|
||||
id: SYS-IAC-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [devops, cloud, automation, infrastructure, terraform]
|
||||
tags: [devops, infrastructure, iac, terraform, automation, scalability]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Infrastructure as Code (IaC, 코드형 인프라)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "클라우드 인프라를 소프트웨어처럼 버전 관리하고 배포하라" — 수동 설정을 배제하고 명시적인 코드(YAML, JSON, DSL)를 통해 서버, 네트워크, DB 등 인프라 전체를 생성하고 관리하는 방식.
|
||||
> "데이터센터를 프로그래밍하고, 서버 설정을 Git으로 관리하여 인프라의 재현성과 확장성을 소프트웨어 수준으로 끌어올려라" — 수동적인 인프라 구성을 배제하고, 선언적(Declarative) 혹은 명령적(Imperative) 코드를 통해 컴퓨팅 자원을 자동으로 생성, 설정, 관리하는 방법론.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** 인프라의 최종 희망 상태(Desired State)를 코드로 선언하고, 도구가 실제 환경과 일치하도록 자동 조정하는 선언적(Declarative) 관리 패턴.
|
||||
- **세부 내용:**
|
||||
- **Immutability:** 인프라를 수정하는 대신 새로운 설정으로 교체하여 '구성 표류(Configuration Drift)' 방지.
|
||||
- **Version Control:** 인프라 변경 이력을 Git으로 관리하여 사고 발생 시 즉각 복구 가능.
|
||||
- **Scalability:** 동일한 코드를 복제하여 여러 환경(Dev, Staging, Prod)을 순식간에 구축.
|
||||
- **Key Tools:** Terraform, CloudFormation, Ansible, Pulumi 등.
|
||||
- **추출된 패턴:** "Immutable Infrastructure" — 기존 서버를 수정하는 대신 코드를 통해 새로운 서버를 생성하고 교체함으로써 구성 드리프트(Configuration Drift)를 원천 차단하고 환경의 일관성을 유지하는 패턴.
|
||||
- **주요 도구:**
|
||||
- **Provisioning:** Terraform, CloudFormation (인프라 뼈대 구축).
|
||||
- **Configuration Management:** Ansible, Puppet (내부 소프트웨어 설정).
|
||||
- **IaC의 핵심 가치:**
|
||||
- **Reproducibility:** 개발, 테스트, 운영 환경을 동일하게 100% 복제 가능.
|
||||
- **Version Control:** 인프라 변경 이력을 Git에서 추적하고 문제가 생기면 즉시 롤백.
|
||||
- **Automation:** 사람이 개입하지 않는 CI/CD 파이프라인의 완성.
|
||||
- **의의:** 클라우드 네이티브 환경에서 대규모 인프라를 효율적으로 운영하기 위한 필수 기반 기술.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 관리 콘솔에서 일일이 클릭하던 방식에서, 코드 한 줄로 수천 대의 서버를 제어하는 자동화 시대로 진입.
|
||||
- **정책 변화:** Antigravity의 클라우드 인프라는 전량 Terraform으로 관리되며, 모든 변경 사항은 GitHub Actions를 통해 검증 후 배포됨.
|
||||
- **과거 데이터와의 충돌:** 관리자가 터미널에 접속해 직접 명령어를 입력하던 방식에서, 이제는 코드가 인프라의 '유일한 진실(Source of Truth)'이 되는 시대로 완전히 전환됨.
|
||||
- **정책 변화:** Antigravity 프로젝트의 모든 클라우드 브레인 노드와 데이터베이스 설정은 Terraform 코드로 관리되며, 인프라의 모든 변경 사항은 코드 리뷰를 거쳐 자동 배포됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[DevOps]], [[GitHub-Actions-CI-CD]], [[Cloud-Computing]], [[Immutability]]
|
||||
- [[DevOps-for-AI-MLOps]], [[High-Availability-Systems]], [[Hybrid-Cloud-Architectures]], [[Git-Version-Control-Master]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Infrastructure-as-Code-IaC.md]]
|
||||
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: CS-OOP-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [programming, oop, inheritance, polymorphism, software-design]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Inheritance and Polymorphism (상속과 다형성)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "부모의 자산을 물려받아 지식을 확장하고, 하나의 이름으로 수만 가지의 다채로운 행동을 수행하라" — 코드의 재사용성을 극대화하는 상속(Inheritance)과, 동일한 메시지에 대해 객체마다 다르게 반응하도록 설계하는 다형성(Polymorphism)을 통해 유연하고 확장 가능한 시스템을 구축하는 객체 지향의 핵심 원리.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Abstraction and Specialization" — 공통된 특성을 추상 클래스나 인터페이스로 정의하고, 이를 상속받아 구체적인 기능을 구현함으로써 복잡한 시스템의 계층 구조를 체계화하는 설계 패턴.
|
||||
- **핵심 개념:**
|
||||
- **Inheritance:** 기존 클래스(Parent)의 필드와 메서드를 새로운 클래스(Child)가 물려받아 확장. "Is-a" 관계 형성.
|
||||
- **Polymorphism:** 하나의 변수나 메서드가 여러 타입을 가질 수 있는 성질. 오버라이딩(Overriding)과 오버로딩(Overloading)을 통해 실현.
|
||||
- **의의:** 결합도(Coupling)를 낮추고 응집도(Cohesion)를 높여, 코드 한 곳을 수정했을 때 시스템 전체에 미치는 악영향을 최소화함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 깊은 상속 계층이 오히려 유지보수를 어렵게 만든다는 반성 하에, 최근에는 "상속보다 합성(Composition over Inheritance)"을 우선시하는 설계 철학이 대두됨.
|
||||
- **정책 변화:** Antigravity 프로젝트의 에이전트 스킬 설계 시, 기본 기능을 상속받되 구체적인 동작은 다형성을 활용하여 각 에이전트의 특성에 맞춰 구현하는 '플러그인 아키텍처'를 준수함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Software-Architecture-Patterns]], [[Functional-Programming]], [[Domain-Driven-Design-DDD]], [[System-Design-for-AI-Scale]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Inheritance-and-Polymorphism.md]]
|
||||
@@ -0,0 +1,32 @@
|
||||
---
|
||||
id: MATH-INNER-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [math, linear-algebra, inner-product, vector-space, similarity-metrics, ai]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Inner Product Spaces (내적 공간)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "추상적인 벡터들 사이에 거리를 재고 각도를 측정하여, 데이터 간의 '닮음'을 기하학적으로 정의하라" — 벡터 공간에 내적(Inner Product)이라는 연산이 추가되어 길이(Norm)와 각도(Orthogonality)를 계산할 수 있게 된 공간.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** 고차원 데이터 공간에서 두 요소 사이의 상관관계를 스칼라 값 하나로 응축하여, 데이터의 유사성이나 투영(Projection)을 계산하는 선형 대수적 분석 패턴.
|
||||
- **핵심 성질:**
|
||||
- **Positivity:** 자기 자신과의 내적은 항상 0 이상.
|
||||
- **Symmetry (Conjugate Symmetry):** 순서를 바꿔도 결과가 일정함.
|
||||
- **Linearity:** 벡터의 합과 스칼라 곱에 대해 선형성이 유지됨.
|
||||
- **AI에서의 응용:**
|
||||
- **Cosine Similarity:** 두 벡터의 내적을 각각의 크기로 나누어 '방향의 일치도' 측정.
|
||||
- **Projection:** 특정 벡터를 다른 벡터 축으로 투영하여 특징을 추출하거나 차원을 축소(PCA).
|
||||
- **Kernel Methods:** 데이터를 더 높은 차원의 내적 공간으로 보내 복잡한 경계를 선형적으로 분리.
|
||||
- **의의:** AI가 지식을 벡터로 변환(Embedding)하고 이를 검색하거나 비교하는 모든 수치적 연산의 이론적 토대.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순한 유클리드 거리 중심에서 벗어나, 데이터의 분포와 맥락을 반영하는 다양한 내적 정의와 유사도 지표(Dot product, Cosine similarity 등)의 중요성 대두.
|
||||
- **정책 변화:** Antigravity 프로젝트는 문서 간 유사도 분석 시, 내적 공간 상의 코사인 유사도를 기본 지표로 사용하여 의미적으로 가장 가까운 지식들을 추천함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Linear-Algebra-Foundations]], [[Vector-Database-Foundations]], [[Dimensionality-Reduction]], [[Information-Retrieval-IR]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Inner-Product-Spaces.md]]
|
||||
@@ -0,0 +1,29 @@
|
||||
---
|
||||
id: SEC-INPUT-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [security, software-engineering, input-validation, data-integrity, defensive-programming]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Input Validation Strategies (입력 검증 전략)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "모든 외부 입력을 잠재적 위협으로 간주하고, 시스템의 경계에서 데이터의 형식과 의도를 엄격히 심사하라" — 사용자나 다른 시스템으로부터 유입되는 데이터가 기대하는 형식, 길이, 타입에 맞는지 확인하여 인젝션 공격이나 런타임 오류를 원천 차단하는 방어적 설계 전략.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Never Trust User Input" — 신뢰할 수 없는 경계(Trust Boundary)를 통과하는 모든 데이터에 대해 화이트리스트 기반의 검증을 수행하고, 안전한 형태로 변환(Sanitization)하여 시스템 내부로 전달하는 필터링 패턴.
|
||||
- **주요 전략:**
|
||||
- **Type Checking:** 기대하는 데이터 타입(String, Int 등) 여부 확인.
|
||||
- **Range & Format Validation:** 숫자의 범위나 이메일/날짜 등의 정규식 패턴 검치.
|
||||
- **Whitelisting:** 허용된 값의 목록 외에는 모두 거부 (가장 안전한 방식).
|
||||
- **Sanitization:** 위험한 특수 문자(<, >, ' 등)를 안전한 문자로 치환.
|
||||
- **의의:** SQL Injection, XSS, Buffer Overflow 등 고질적인 소프트웨어 보안 취약점의 80% 이상을 예방할 수 있는 가장 기본적이고 강력한 보안 수단.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순한 문법적 검증에서 벗어나, 이제는 LLM 시대에 맞춰 '프롬프트 인젝션'과 같은 의미론적 위협(Semantic Threat)을 감지하고 차단하는 지능형 검증이 필수적으로 요구됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트에게 전달되는 모든 사용자 발화와 외부 파일 데이터를 처리하기 전, 보안 스캔 및 형식 검증 레이어를 거치도록 강제함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Software-Architecture-Patterns]], [[Cloud-Security-Mastery]], [[Data-Privacy-Foundations]], [[LLM-Security-and-Safety]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Input-Validation-Strategies.md]]
|
||||
@@ -0,0 +1,30 @@
|
||||
---
|
||||
id: ML-INST-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [machine-learning, instance-based-learning, knn, lazy-learning, similarity-metrics]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Instance-based Learning (사례 기반 학습)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "복잡한 수식을 만들지 말고, 가장 닮은 과거의 이웃에게 길을 물어 답을 찾아라" — 별도의 학습 과정 없이 훈련 데이터를 그대로 저장해 두었다가, 새로운 데이터가 유입될 때마다 유사도 측정을 통해 가장 가까운 사례들의 정답을 인용하는 머신러닝 방식.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Lazy Learning" — 추상적인 모델을 구축하는 비용을 아끼는 대신, 추론 시점에 모든 연산을 집중하여 실시간으로 데이터 간의 거리를 계산하는 지연 추론 패턴.
|
||||
- **핵심 알고리즘:**
|
||||
- **k-Nearest Neighbors (k-NN):** 가장 가까운 k개의 이웃을 찾아 다수결이나 평균으로 예측.
|
||||
- **Case-Based Reasoning (CBR):** 과거의 성공 사례를 검색하고, 현재 문제에 맞게 수정하여 적용.
|
||||
- **장점 및 단점:**
|
||||
- **장점:** 데이터가 추가될 때 재학습이 필요 없음. 국지적(Local) 특징 반영에 강함.
|
||||
- **단점:** 데이터가 많아질수록 추론 속도가 급격히 느려짐(연산 부하). 노이즈에 취약함.
|
||||
- **의의:** 추천 시스템(Collaborative Filtering)이나 이상 징후 탐지 등 데이터의 유사성이 판단의 핵심인 분야에서 널리 활용됨.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 연산 성능의 한계로 소규모 데이터에만 쓰이던 방식이, 이제는 벡터 데이터베이스와 고성능 인덱싱 기술(HNSW 등)의 발전으로 수억 건의 데이터에서도 실시간 사례 기반 추론이 가능해짐.
|
||||
- **정책 변화:** Antigravity 프로젝트의 지식 추천 엔진은 사용자의 현재 문맥과 가장 유사한 과거의 위키 탐색 경로를 찾아주는 사례 기반 추천 방식을 병행하여 개인화된 경험을 제공함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Indexing-Strategies]], [[Vector-Database-Foundations]], [[Supervised-Learning-Foundations]], [[Distance-Metrics-in-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Instance-based-Learning.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: QA-INT-TEST-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [software-engineering, testing, ai-qa, integration-testing, reliability, mlops]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Integration Testing for AI (AI 통합 테스트)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "개별 부품의 완벽함에 안주하지 말고, 그들이 톱니바퀴처럼 맞물려 돌아가는 전체의 하모니를 검증하라" — 여러 소프트웨어 모듈과 AI 모델, 외부 데이터 소스 등이 유기적으로 연결되어 데이터 파이프라인과 비즈니스 로직이 올바르게 작동하는지 확인하는 품질 보증 프로세스.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Contract Testing" — 각 컴포넌트 간의 입출력 규약(Interface)이 준수되는지 확인하고, 특히 비결정론적인 AI 모델의 응답이 전체 시스템의 예외 처리 로직을 무너뜨리지 않는지 검증하는 흐름 보장 패턴.
|
||||
- **주요 테스트 영역:**
|
||||
- **Data Pipeline Integration:** 수집된 Raw 데이터가 전처리 과정을 거쳐 위키 인덱스까지 무결하게 도달하는가?
|
||||
- **Agent-Tool Interaction:** 에이전트가 외부 도구(Git, 파일 시스템 등)를 호출하고 그 결과를 올바르게 해석하는가?
|
||||
- **Model-UI Sync:** AI의 실시간 스트리밍 응답이 프론트엔드 아키텍처 상에서 깨짐 없이 렌더링되는가?
|
||||
- **도전 과제:** AI 응답의 가변성으로 인해 전통적인 Assert 문 사용이 힘듦. -> 확률적 범위 검증(Probabilistic Testing)이나 골든셋(Golden Set) 비교 기법 활용.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 정적 코드를 검증하던 방식에서, 데이터의 변화와 모델의 확률적 특성까지 고려해야 하는 '동적 시스템 검증'으로 테스트의 난이도와 중요도가 급상승함.
|
||||
- **정책 변화:** Antigravity 프로젝트는 모든 커밋 전, 에이전트의 주요 시나리오(지식 생성, 파일 수정 등)를 시뮬레이션하는 통합 테스트 자동화 스크립트를 실행하여 시스템의 강건성을 유지함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[DevOps-for-AI-MLOps]], [[Software-Architecture-Patterns]], [[Input-Validation-Strategies]], [[System-Design-for-AI-Scale]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Integration-Testing-for-AI.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: ETH-IP-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, intellectual-property, copyright, ai-ethics, law, generative-ai]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Intellectual Property in AI (AI와 지식 재산권)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "기계의 창작물에 누구의 이름을 새길 것인가, 그리고 거인의 어깨 위에 올라타는 과정에서 타인의 권리를 어떻게 존중할 것인가" — 인공지능 학습 데이터의 정당한 사용(Fair Use)과 AI 생성 콘텐츠의 저작권 보호 여부를 둘러싼 법적, 윤리적 논의의 총체.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Ownership Paradox" — 인간의 창의성이 가미되지 않은 기계의 순수 출력물은 현재의 법체계 하에서 저작권을 인정받기 어려우며, 방대한 데이터를 학습하는 행위와 창작자의 권익 보호 사이의 충돌을 해결하려는 권리 조정 패턴.
|
||||
- **주요 쟁점:**
|
||||
- **Training Data:** 공개된 데이터를 학습에 사용하는 것이 '공정 이용'에 해당하는가? (Opt-in vs Opt-out).
|
||||
- **AI Authorship:** AI가 단독으로 생성한 시, 그림, 코드의 저작권자는 누구인가? (인간 프롬프트 작성자 vs 모델 개발사 vs 없음).
|
||||
- **Derivative Works:** AI 생성물이 특정 작가의 화풍이나 문체를 모방했을 때 발생하는 침해 문제.
|
||||
- **의의:** AI 산업의 상업적 토대를 결정짓는 핵심 변수이며, 지식의 공유와 창작자의 권리 사이의 새로운 사회적 계약이 필요함을 시사.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 지식 재산권이 인간만의 전유물이라 믿던 전통적 관념이 흔들리며, 전 세계적으로 AI 관련 저작권 가이드라인이 실시간으로 수립되고 있음.
|
||||
- **정책 변화:** Antigravity 프로젝트는 외부 지식 인덱싱 시 데이터의 출처(Provenance)를 명확히 기록하며, 상업적 이용이 제한된 소스로부터 생성된 지식은 내부 연구용으로만 격리하여 관리함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[AI-Ethics]], [[Generative-AI-Impact]], [[Deepfake-Technology]], [[Data-Privacy-Foundations]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Intellectual-Property-in-AI.md]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: AI-INT-EXP-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, explainable-ai, xai, interpretability, explainability, trust]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Interpretability vs Explainability (해석 가능성 vs 설명 가능성)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "모델의 내부 회로를 투명하게 들여다보는 것과, 모델이 왜 그런 행동을 했는지 인간의 언어로 설득하는 것은 별개의 문제다" — AI 시스템의 투명성을 확보하기 위한 두 가지 접근법으로, 구조적 투명성(Interpretability)과 결과에 대한 논리적 서술(Explainability) 사이의 관계와 차이.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "White-box vs Post-hoc Explanation" — 모델의 설계 자체가 단순하여 인간이 직관적으로 이해할 수 있게 하거나(Interpretability), 복잡한 모델의 결과를 사후적으로 분석하여 인간이 이해할 수 있는 형태로 재해석(Explainability)하는 신뢰 구축 패턴.
|
||||
- **핵심 차이:**
|
||||
- **Interpretability:** 모델이 '어떻게' 작동하는지에 대한 정밀한 파악. (예: 작은 의사결정 나무, 선형 회귀). 모델이 작을수록 높음.
|
||||
- **Explainability:** 모델이 '왜' 그런 결과를 냈는지에 대한 인간 중심의 설명. (예: LIME, SHAP, 어텐션 맵 시각화). 모델이 복잡해도 사후 설명 가능.
|
||||
- **의의:** AI가 사회적으로 중요한 결정(대출 승인, 자율주행 사고, 의료 진단)을 내릴 때, 그 근거를 제시함으로써 책임 소재를 명확히 하고 사용자의 신뢰를 얻는 핵심 수단.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 성능과 투명성은 반비례한다는 믿음(Trade-off)을 극복하기 위해, 최근에는 거대 모델의 내부 활성화 패턴을 분석하여 개념 단위의 해석을 시도하는 기법(Mechanistic Interpretability)이 발전 중.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 답변에 항상 `Rationale` 섹션을 포함시켜 '설명 가능성'을 확보하며, 복잡한 추론 과정은 지식 그래프 상의 연결 경로로 '해석 가능성'을 보조함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Explainable-AI-XAI]], [[Trustworthy-AI]], [[AI-Ethics]], [[Decision-Trees-and-Random-Forests]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Interpretability-vs-Explainability.md]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: RL-INV-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, reinforcement-learning, inverse-rl, imitation-learning, apprenticeship-learning]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Inverse Reinforcement Learning (역강화학습)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "모델에게 무엇이 좋은지 알려주지 말고, 전문가의 행동을 관찰하여 스스로 '보상(Reward)'의 의미를 추론하게 하라" — 명시적인 보상 함수를 정의하기 어려운 복잡한 태스크에서, 전문가의 시연(Demonstration)을 보고 에이전트가 그 내면에 깔린 보상 체계를 역으로 학습하는 기법.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Learning from Observation" — 결과값(Reward)이 주어지는 일반 강화학습과 달리, 전문가의 궤적(Trajectories)을 데이터로 삼아 에이전트가 지향해야 할 목표 함수 자체를 도출하는 관찰 기반 학습 패턴.
|
||||
- **주요 알고리즘:**
|
||||
- **Maximum Entropy IRL:** 전문가의 행동을 가장 잘 설명하면서도 가장 불확실성이 높은(편향되지 않은) 보상 함수 탐색.
|
||||
- **Apprenticeship Learning:** 추출된 보상 함수를 바탕으로 전문가의 성능을 재현하거나 능가하도록 학습.
|
||||
- **의의:** 인간이 말로 설명하기 힘든 복잡한 가치 판단이나 '운전 스타일', '숙련된 작업 방식' 등을 AI에게 효과적으로 이식할 수 있음.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순 모방 학습(Behavioral Cloning)은 관측되지 않은 상황에서 급격히 성능이 저하되지만, IRL은 행동의 '근본 목적'을 배우기에 훨씬 더 높은 일반화 능력을 보여줌.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트가 사용자의 작업 패턴을 학습할 때, 단순한 명령 복제가 아닌 IRL을 적용하여 사용자가 진정으로 의도한 '작업의 품질 기준'을 스스로 파악하도록 설계함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Reinforcement-Learning]], [[Imitation-Learning]], [[Reward-Shaping]], [[Generalization-in-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Inverse-Reinforcement-Learning.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: IOT-AI-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [iot, ai, aiot, edge-computing, smart-systems, sensor-networks]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[IoT and AI Integration (IoT와 AI 통합)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "사물에 감각(IoT)을 달고 지능(AI)을 심어, 현실 세계와 디지털 세계를 유기적으로 연결하라" — 수많은 센서로부터 유입되는 방대한 시계열 데이터를 AI가 실시간으로 처리하여 자율적 판단과 예측을 수행하는 AIoT(AI of Things) 아키텍처.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Edge-to-Cloud Intelligence" — 지연 시간(Latency)이 중요한 작업은 현장의 엣지 기기에서 즉시 처리하고, 거대 데이터 분석 및 장기 학습은 클라우드에서 수행하는 계층적 지능 연산 패턴.
|
||||
- **주요 가치:**
|
||||
- **Predictive Maintenance:** 장비의 미세한 진동/소음 변화를 감지하여 고장 전 사전 정비.
|
||||
- **Context Awareness:** 사용자의 위치, 조도, 온도 등을 종합하여 최적의 환경 자동 제공.
|
||||
- **Energy Efficiency:** 전력 소비 패턴을 학습하여 낭비 요소를 실시간 차단.
|
||||
- **의의:** AI가 모니터 속의 가상 데이터를 넘어 실제 물리 세계의 문제를 해결하고 제어하는 실질적인 힘을 갖게 함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순히 데이터를 클라우드로 전송(Cloud-only)하던 방식에서, 보안과 속도를 위해 기기 자체에서 AI를 구동하는 '온디바이스 AI'와 '엣지 컴퓨팅' 중심으로 패러다임 전환.
|
||||
- **정책 변화:** Antigravity 프로젝트는 로컬 하드웨어 센서 데이터를 처리할 때, 데이터의 프라이버시 보호를 위해 엣지 단계에서의 1차 필터링 및 익명화 처리를 필수 원칙으로 함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Edge-AI-and-Computing]], [[Cloud-Security-Mastery]], [[Real-time-Data-Processing]], [[Hybrid-Cloud-Architectures]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/IoT-and-AI-Integration.md]]
|
||||
@@ -0,0 +1,29 @@
|
||||
---
|
||||
id: ETH-ASIMOV-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai-ethics, robotics, asimov, alignment, safety-guardrails]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Isaac Asimov's Laws of Robotics (아시모프의 로봇 3원칙)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "인공적 지능의 가장 높은 우선순위는 기술적 효율성이 아닌 '인간의 생명과 존엄성'에 있음을 명시하라" — 아이작 아시모프가 정립한 로봇의 행동 윤리 규범으로, 현대 인공지능 정렬(Alignment) 문제의 철학적 뿌리가 된 세 가지 핵심 법칙.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Hierarchical Constraints" — 하위 법칙보다 상위 법칙을 우선시하는 계층적 제약 조건을 통해, 지능 시스템이 복잡한 상황에서도 일관된 윤리적 판단을 내리도록 강제하는 안전 장치 패턴.
|
||||
- **로봇 3원칙:**
|
||||
- **제1원칙:** 로봇은 인간에게 해를 입혀서는 안 되며, 위험에 처한 인간을 방관해서도 안 된다.
|
||||
- **제2원칙:** 제1원칙에 위배되지 않는 한, 인간의 명령에 복종해야 한다.
|
||||
- **제3원칙:** 제1, 2원칙에 위배되지 않는 한, 자신의 존재를 보호해야 한다.
|
||||
- **제0원칙 (사후 추가):** 로봇은 인류 전체에게 해를 입혀서는 안 된다 (개별 인간보다 인류라는 종의 생존 우선).
|
||||
- **의의:** AI 에이전트의 목표 함수(Objective Function)가 인간의 의도 및 보편적 도덕률과 어긋날 때 발생하는 위험을 방지하기 위한 논의의 시발점.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 아시모프의 원칙은 문학적 장치로서 '법칙 간의 충돌과 모순'을 보여주는 데 초점이 맞춰져 있었으나, 현대 AI 연구에서는 이를 실제 코드로 구현하기 위한 수치적 정렬(Constitutional AI 등) 기법으로 구체화 중.
|
||||
- **정책 변화:** Antigravity 에이전트는 사용자의 명령이 타인의 권익을 침해하거나 파괴적인 행위를 포함할 경우, 아시모프의 원칙을 현대적으로 재해석한 '안전 가이드라인'에 따라 해당 명령 수행을 거부하도록 설계됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[AI-Ethics]], [[Trustworthy-AI]], [[Constitutional-AI]], [[Human-in-the-loop-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Isaac-Asimovs-Laws-of-Robotics.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: REC-ITEM-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [recommender-systems, collaborative-filtering, item-item, personalization, similarity-metrics]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Item-Item Collaborative Filtering (아이템 기반 협업 필터링)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "사용자의 변덕스러운 취향보다, 아이템 간의 견고한 연관 관계를 바탕으로 정교한 추천 지도를 그려라" — 개별 사용자 간의 유사도를 찾는 대신, 아이템들이 함께 소비된 이력을 분석하여 아이템 간의 유사성을 측정하고 이를 기반으로 사용자에게 새로운 것을 제안하는 추천 알고리즘.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Static Content Relationship" — 사용자의 수는 기하급수적으로 늘어나지만 아이템의 수는 상대적으로 고정되어 있다는 점에 착안하여, 아이템 간 유사도 행렬을 미리 계산(Offline)해두고 실시간(Online) 추천 성능을 극대화하는 패턴.
|
||||
- **작동 원리:**
|
||||
- **Step 1:** 특정 아이템 A와 B를 동시에 선호한 사용자들의 데이터를 수집.
|
||||
- **Step 2:** 코사인 유사도 등을 사용하여 아이템 간의 점수 산정.
|
||||
- **Step 3:** 사용자가 과거에 선호했던 아이템들과 가장 유사한 아이템들을 순위화하여 노출.
|
||||
- **의의:** 사용자 기반(User-based) 방식보다 계산량이 적고 아이템의 특성이 급격히 변하지 않아 추천의 안정성이 높음 (아마존의 성공 비결).
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순한 구매 이력 기반에서, 이제는 딥러닝 임베딩(Matrix Factorization, Graph Embeddings)을 통해 아이템의 의미론적 유사성까지 결합하는 하이브리드 방식으로 진화.
|
||||
- **정책 변화:** Antigravity 프로젝트의 지식 추천 엔진은 사용자가 현재 읽고 있는 문서와 '함께 참조된 빈도'가 높은 다른 지식들을 아이템 기반 필터링으로 분석하여 사이드바에 즉각 제시함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Collaborative-Filtering]], [[Matrix-Factorization]], [[Inner-Product-Spaces]], [[Information-Retrieval-IR]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Item-Item-Collaborative-Filtering.md]]
|
||||
@@ -0,0 +1,29 @@
|
||||
---
|
||||
id: SDLC-ITER-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [software-engineering, agile, iterative-development, lean, sdlc, feedback-loops]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Iterative Development Models (반복적 개발 모델)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "한 번에 거대한 성을 쌓으려 하지 말고, 작은 벽돌부터 완벽하게 다듬으며 점진적으로 세계를 확장하라" — 요구사항이 불명확하거나 기술적 변화가 빠른 환경에서, 짧은 개발 주기(Cycle)를 반복하며 시스템을 조금씩 진화시키고 위험을 조기에 관리하는 소프트웨어 개발 방법론.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Build-Measure-Learn" — 계획, 설계, 구현, 테스트의 전 과정을 작은 단위(Sprint/Batch)로 쪼개어 반복 수행하고, 각 주기마다 동작하는 결과물을 만들어 사용자 피드백을 수용하는 선순환 진화 패턴.
|
||||
- **주요 특징:**
|
||||
- **Risk Management:** 초기 단계에서 결함이나 기획 오류를 발견하여 수정 비용 절감.
|
||||
- **Adaptability:** 변화하는 시장 상황이나 기술적 한계에 유연하게 대응 가능.
|
||||
- **Continuous Improvement:** 매 주기마다 성능과 품질이 누적되어 향상됨.
|
||||
- **대표 모델:** Agile, Scrum, Kanban, Spiral Model.
|
||||
- **의의:** 정답이 정해져 있지 않은 AI 개발 및 탐색적 프로젝트에서 불확실성을 통제하고 성공 확률을 높이는 유일한 실천 대안.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 완벽한 설계도(Architecture Design Document)가 우선이라는 믿음에서 벗어나, 이제는 '실행 가능한 최소 제품(MVP)'과 '빠른 피드백 루프'가 프로젝트 성공의 핵심 지표로 재정립됨.
|
||||
- **정책 변화:** Antigravity 프로젝트의 지식 가드닝 작업은 전형적인 반복적 모델을 따름. 20개 단위의 Batch 작업을 수행하고 트래커를 업데이트하며, 사용자의 피드백을 즉각 반영하여 다음 배치의 품질을 높이는 구조를 유지함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Extreme-Programming-XP]], [[Feedback-Loops-in-Systems]], [[Software-Architecture-Patterns]], [[Agile-Methodologies]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Iterative-Development-Models.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: AI-JIT-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, deep-learning, jit-compilation, xla, torchscript, optimization]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[JIT Compilation in AI Engines (AI 엔진의 JIT 컴파일)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "파이썬의 유연함으로 설계하고, 기계어의 속도로 실행하라" — 모델 실행 시점에 연산 그래프를 분석하여 하드웨어에 최적화된 바이너리 코드로 즉시 변환함으로써, 인터프리팅 오버헤드를 제거하고 성능을 극대화하는 기술.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Graph Capture and Fusion" — 느린 순차 실행 대신 전체 연산 흐름을 하나의 그래프로 캡처하고, 연속된 연산들을 하나로 합쳐(Fusion) 메모리 대역폭 낭비를 줄이는 런타임 최적화 패턴.
|
||||
- **주요 엔진 및 기술:**
|
||||
- **XLA (Accelerated Linear Algebra):** TensorFlow/JAX에서 사용되는 가속 컴파일러. 행렬 연산을 비약적으로 가속.
|
||||
- **TorchScript / torch.compile:** PyTorch 모델을 파이썬 환경 없이 실행 가능하도록 직렬화 및 최적화.
|
||||
- **TVM:** 다양한 하드웨어 백엔드에 맞춰 모델을 컴파일하는 오픈소스 스택.
|
||||
- **의의:** 고수준 언어(Python)의 생산성을 유지하면서도, C++/CUDA 수준의 저수준 실행 성능을 확보하여 AI 연구와 서비스의 간극을 메움.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 정적 그래프(Static Graph) 방식의 불편함을 해결하기 위해, 최근에는 동적 그래프의 유연성을 유지하면서도 부분적으로 JIT 가속을 적용하는 하이브리드 방식(PyTorch 2.0 등)이 주류로 부상함.
|
||||
- **정책 변화:** Antigravity 프로젝트는 실시간 벡터 연산 및 커스텀 로직 수행 시, 성능 병목이 발생하는 구간에 적극적으로 JIT 컴파일러 가속 옵션을 적용하여 처리 속도를 최적화함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Inference-Optimization]], [[Hardware-Acceleration-for-AI]], [[GPU-Architecture-for-AI]], [[Distributed-Computing]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/JIT-Compilation-in-AI-Engines.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: DATA-SER-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [data-engineering, json, serialization, data-exchange, api-design, protobuf]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[JSON and Data Serialization (JSON과 데이터 직렬화)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "복잡한 지능의 구조를 누구나 이해할 수 있는 보편적인 텍스트로 치환하여, 시스템 간의 경계를 허물어라" — 메모리 내의 객체나 데이터 구조를 전송 및 저장 가능한 형식으로 변환(Serialization)하고, 이를 다시 원래 상태로 복원(Deserialization)하는 데이터 유통 기술.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Universal Data Language" — 프로그래밍 언어에 종속되지 않는 텍스트(JSON, YAML)나 이진(Binary) 형식을 사용하여, 서로 다른 기술 스택을 가진 시스템들이 원활하게 데이터를 주고받게 하는 매개 패턴.
|
||||
- **주요 형식:**
|
||||
- **JSON (JavaScript Object Notation):** 인간이 읽기 쉽고 웹 환경에 최적화된 표준.
|
||||
- **Protocol Buffers (Protobuf):** 구글이 개발한 이진 직렬화 형식. 빠르고 용량이 작아 마이크로서비스 간 통신에 유리.
|
||||
- **MessagePack:** JSON과 유사한 구조를 이진 포맷으로 저장하여 효율 증대.
|
||||
- **의의:** 마이크로서비스 아키텍처(MSA), API 통신, 설정 파일 관리 등 현대 소프트웨어 생태계의 데이터 교환을 가능케 함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** XML의 복잡함을 걷어내고 JSON이 승리했으나, 최근에는 대규모 데이터 처리 성능을 위해 다시 엄격한 스키마를 가진 이진 직렬화 방식이 각광받는 순환적 발전 양상을 보임.
|
||||
- **정책 변화:** Antigravity 프로젝트는 모든 메타데이터와 지식 그래프를 JSON 형식으로 관리하여 인간의 가독성을 확보하되, 고성능 에이전트 간 통신 시에는 Protobuf를 적용하여 네트워크 부하를 최소화함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Input-Validation-Strategies]], [[System-Design-for-AI-Scale]], [[Knowledge-Graph-Foundations]], [[Cloud-Security-Mastery]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/JSON-and-Data-Serialization.md]]
|
||||
@@ -0,0 +1,31 @@
|
||||
---
|
||||
id: QA-TEST-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [software-engineering, testing, junit, unit-test, tdd, quality-assurance]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[JUnit and Testing Frameworks (JUnit과 테스트 프레임워크)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "작성한 코드의 무결성을 증명하는 가장 강력한 무기는, 매 커밋마다 실행되는 수천 개의 자동화된 감시자들이다" — 개별 모듈이 의도한 대로 작동하는지 확인하는 단위 테스트를 정형화하고 자동화하여, 소프트웨어의 신뢰도를 높이고 리팩토링의 용기를 부여하는 프레임워크.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Arrange-Act-Assert" — 테스트 환경을 구성(Arrange)하고, 실제 기능을 실행(Act)한 뒤, 결과가 기대와 일치하는지 검증(Assert)하는 표준화된 테스트 시나리오 패턴.
|
||||
- **핵심 기능:**
|
||||
- **Annotations:** `@Test`, `@BeforeEach`, `@AfterEach` 등을 통해 테스트 생명주기 관리.
|
||||
- **Assertions:** `assertEquals`, `assertTrue` 등을 통한 결과 검증.
|
||||
- **Mocking:** 외부 의존성(DB, API 등)을 가짜 객체로 대체하여 독립적인 테스트 수행 (Mockito 등).
|
||||
- **현대적 확장:**
|
||||
- **Jest (JS/TS):** 프론트엔드 환경에 최적화된 스냅샷 테스트 지원.
|
||||
- **Pytest (Python):** 간결한 문법과 강력한 Fixture 기능을 제공하는 AI 개발의 표준.
|
||||
- **의의:** 테스트 주도 개발(TDD)을 가능케 하여, 코드의 품질을 사후가 아닌 설계 단계부터 관리할 수 있게 함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 테스트 코드는 '시간 낭비'라는 인식에서 벗어나, 이제는 테스트 코드 없이는 단 한 줄의 코드도 운영 환경에 배포할 수 없는 '안전의 최전선'으로 대두됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 모든 신규 기능 추가 시 해당 로직을 검증하는 Pytest/Jest 코드를 반드시 포함해야 하며, CI 과정에서 테스트 성공률 100%를 달성해야만 머지가 허용됨.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Integration-Testing-for-AI]], [[DevOps-for-AI-MLOps]], [[Software-Architecture-Patterns]], [[Input-Validation-Strategies]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/JUnit-and-Testing-Frameworks.md]]
|
||||
@@ -0,0 +1,30 @@
|
||||
---
|
||||
id: JS-ASYNC-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [javascript, frontend, web-development, event-loop, async-await, concurrency]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[JavaScript Async and Event Loop (JS 비동기와 이벤트 루프)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "싱글 스레드의 제약을 '기다림의 미학'으로 극복하고, 이벤트 루프라는 영리한 중재자를 통해 멈추지 않는 사용자 경험을 완성하라" — 자바스크립트가 단일 스레드임에도 불구하고 논블로킹(Non-blocking) I/O를 수행하며 수많은 비동기 작업을 효율적으로 처리하게 해주는 핵심 구동 메커니즘.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Single-threaded Concurrency" — 콜 스택(Call Stack)이 비었을 때 태스크 큐(Task Queue)에 대기 중인 콜백 함수를 순차적으로 실행하여, 무거운 작업이 메인 스레드를 점유(Blocking)하지 않도록 관리하는 스케줄링 패턴.
|
||||
- **핵심 구성 요소:**
|
||||
- **Call Stack:** 현재 실행 중인 함수들이 쌓이는 곳.
|
||||
- **Web APIs:** 브라우저가 제공하는 비동기 작업(타이머, 네트워크 요청 등) 수행.
|
||||
- **Callback Queue (Task Queue):** 비동기 작업 완료 후 실행될 콜백들이 대기하는 곳.
|
||||
- **Microtask Queue:** Promise의 `.then` 등 우선순위가 높은 비동기 작업이 대기 (일반 태스크 큐보다 먼저 실행).
|
||||
- **Event Loop:** 콜 스택과 큐를 상시 감시하며 작업을 옮겨주는 중재자.
|
||||
- **의의:** 현대 웹 프론트엔드의 부드러운 애니메이션과 실시간 반응성을 지탱하는 기술적 뿌리.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 콜백 지옥(Callback Hell)에서 벗어나, Promise와 `async/await`라는 문법적 설탕(Syntactic Sugar)을 통해 비동기 코드를 동기 코드처럼 직관적으로 작성하는 시대로 완전히 전이됨.
|
||||
- **정책 변화:** ConnectAI 확장 프로그램은 VS Code의 메인 스레드를 방해하지 않기 위해, 모든 대규모 지식 검색 및 모델 호출 로직을 비동기 이벤트 루프 최적화 패턴에 따라 처리함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Frontend-Architecture]], [[Message-Queues-and-Event-Streams]], [[System-Design-for-AI-Scale]], [[Reactive-Programming]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/JavaScript-Async-and-Event-Loop.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: DATA-JIT-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [data-engineering, jit-loading, lazy-loading, optimization, deep-learning, performance]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Just-in-time Data Loading (적시 데이터 로딩)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "메모리의 한계에 굴복하지 말고, 필요한 정보만을 가장 필요한 순간에 흐르듯 공급하라" — 전체 데이터를 메모리에 미리 적재하는 대신, 연산 직전에 필요한 부분만을 디스크나 네트워크로부터 비동기적으로 읽어와 처리하는 효율적인 데이터 공급 전략.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Lazy Fetch and Prefetch" — 실제 사용 시점까지 로딩을 지연(Lazy Loading)시키되, 연산의 병목을 막기 위해 다음 데이터를 미리 예측하여 백그라운드에서 로딩(Prefetching)하는 이중화된 최적화 패턴.
|
||||
- **주요 기술 및 라이브러리:**
|
||||
- **PyTorch DataLoader:** 멀티 프로세싱을 활용하여 GPU가 학습하는 동안 CPU가 다음 배치를 준비.
|
||||
- **Streaming Datasets:** 테라바이트급 데이터를 다운로드 없이 클라우드에서 실시간으로 스트리밍하며 학습.
|
||||
- **Memory Mapping (mmap):** 파일을 메모리 주소 공간에 매핑하여 필요할 때만 OS가 데이터를 읽어오게 함.
|
||||
- **의의:** 하드웨어 자원의 한계를 극복하고 대규모 데이터셋(LLM 학습 등)을 안정적으로 처리할 수 있게 함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 고가의 대용량 메모리 증설로 해결하던 문제를, 이제는 똑똑한 소프트웨어 스케줄링과 비동기 I/O 설계를 통해 비용 효율적으로 해결하는 방향으로 진화.
|
||||
- **정책 변화:** Antigravity 프로젝트는 1,174개의 지식 베이스를 전수 조사할 때, 전체를 메모리에 올리지 않고 JIT 로딩 방식을 적용하여 시스템 리소스 점유율을 10% 미만으로 유지함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Inference-Optimization]], [[System-Design-for-AI-Scale]], [[Deep-Learning-Foundations]], [[Cloud-Computing-Foundations]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Just-in-time-Data-Loading.md]]
|
||||
@@ -0,0 +1,29 @@
|
||||
---
|
||||
id: ML-KMEANS-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [machine-learning, unsupervised-learning, clustering, k-means, centroids]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[K-Means Clustering Foundations (K-Means 클러스터링 기초)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터들 사이의 '무게 중심'을 찾아, 혼돈 속에 숨겨진 집단(Clusters)의 경계를 그려라" — 주어진 데이터를 K개의 클러스터로 묶는 알고리즘으로, 각 클러스터 내의 데이터와 중심점(Centroid) 사이의 거리 합을 최소화하는 방식으로 작동하는 비지도 학습의 고전.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Iterative Refinement" — 무작위로 할당된 중심점에서 시작하여, 데이터 할당(Assignment)과 중심점 업데이트(Update)를 반복하며 최적의 군집을 찾아가는 반복적 최적화 패턴.
|
||||
- **작동 단계:**
|
||||
- **Initialization:** K개의 초기 중심점 설정 (K-means++ 등을 사용하여 개선 가능).
|
||||
- **Assignment:** 각 데이터를 가장 가까운 중심점에 할당.
|
||||
- **Update:** 할당된 데이터들의 평균값으로 중심점 이동.
|
||||
- **Convergence:** 중심점의 위치 변화가 없을 때까지 반복.
|
||||
- **의의:** 고객 세그먼트 분석, 이미지 압축(Color Quantization), 이상치 탐지 등 데이터의 숨겨진 구조를 파악해야 하는 다양한 분야의 토대.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 원형(Spherical) 형태의 군집만 잘 찾는다는 한계가 있으며, 최근에는 데이터의 복잡한 기하학적 구조를 반영할 수 있는 DBSCAN이나 스펙트럴 클러스터링으로 보완되어 사용됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 수만 개의 로우 데이터 로그를 의미 단위로 묶어 지식화할 때, 초기 필터링 단계에서 K-Means 기반의 대규모 클러스터링을 활용하여 데이터의 중복성을 제거함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Unsupervised-Learning-Foundations]], [[Dimensionality-Reduction]], [[Distance-Metrics-in-AI]], [[Exploratory-Data-Analysis]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/K-Means-Clustering-Foundations.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: ML-KNN-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [machine-learning, knn, instance-based-learning, similarity-metrics, classification]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[K-Nearest Neighbors (K-NN, K-최근접 이웃)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터의 정체는 그 주변에 누가 있느냐에 따라 결정된다" — 새로운 데이터의 레이블을 예측할 때, 특징 공간 상에서 가장 가까운 K개의 훈련 데이터(이웃)를 찾아 그들의 다수결(분류)이나 평균(회귀)으로 값을 결정하는 직관적인 알고리즘.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Proximity-based Reasoning" — 별도의 학습 과정 없이 데이터 사이의 거리를 계산하여 즉각적으로 결론을 내리는 사례 기반 학습(Instance-based Learning) 패턴.
|
||||
- **핵심 요소:**
|
||||
- **Distance Metrics:** 유클리디안(Euclidean), 맨해튼(Manhattan), 코사인(Cosine) 거리 등 데이터의 특성에 맞는 척도 선택이 중요.
|
||||
- **K value:** 이웃의 수. K가 너무 작으면 노이즈에 민감(Overfitting), 너무 크면 경계가 모호(Underfitting)해짐.
|
||||
- **Feature Scaling:** 모든 특징이 거리 계산에 공평하게 반영되도록 정규화(Normalization) 필수.
|
||||
- **의의:** 알고리즘이 매우 단순하여 구현이 쉽고, 데이터의 분포가 비선형적이거나 복잡할 때도 훌륭한 기준(Baseline) 성능을 제공함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 차원의 저주(Curse of Dimensionality)로 인해 고차원 데이터에서 성능이 급감한다는 한계가 있으나, 최근에는 PCA 등을 통한 차원 축소나 고성능 근사 근접 이웃(ANN) 검색 기술과 결합하여 한계를 극복함.
|
||||
- **정책 변화:** Antigravity 프로젝트는 유사한 문맥을 가진 지식을 검색할 때, 의미 벡터 공간에서의 K-NN 탐색을 통해 가장 관련성이 높은 문서 후보군을 즉시 도출함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Instance-based-Learning]], [[Distance-Metrics-in-AI]], [[Dimensionality-Reduction]], [[Indexing-Strategies]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/K-Nearest-Neighbors-K-NN.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: MATH-KALMAN-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [math, robotics, control-theory, kalman-filter, state-estimation, sensor-fusion]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Kalman Filter and State Tracking (칼만 필터와 상태 추적)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "불확실한 정보들 사이에서 가장 믿음직한 정답을 확률적으로 조율하라" — 과거의 상태와 현재의 측정값을 결합하여, 잡음이 섞인 데이터로부터 시스템의 상태를 최적의 확률로 추정하는 순귀적 필터.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Prediction-Correction Cycle" — 이전 단계의 지식을 바탕으로 현재를 예측(Predict)하고, 실제 센서의 측정값이 들어오면 그 차이를 반영하여 예측치를 수정(Update/Correct)하며 오차를 줄여나가는 반복 패턴.
|
||||
- **주요 단계:**
|
||||
- **Prediction Step:** 시스템의 물리 법칙(운동 방정식 등)을 바탕으로 다음 상태와 불확실성을 예측.
|
||||
- **Kalman Gain:** 예측값과 측정값 중 어느 쪽을 더 신뢰할지 결정하는 가중치 계산.
|
||||
- **Update Step:** 실제 측정값을 반영하여 상태를 수정하고 불확실성을 좁힘.
|
||||
- **의의:** GPS 오차 보정, 로봇의 자기 위치 인식(SLAM), 주식 시장의 추세 분석 등 실시간으로 변하는 데이터를 다루는 모든 제어 시스템의 심장.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 선형 시스템(Linear System)에서만 최적이라는 한계를 넘기 위해, 비선형 환경에서도 작동하는 확장 칼만 필터(EKF)와 파티클 필터(Particle Filter) 등으로 이론적 지평이 넓어짐.
|
||||
- **정책 변화:** Skybound 프로젝트의 유도 미사일 및 적 기동 추적 로직은 칼만 필터를 사용하여 센서 데이터의 노이즈를 제거하고 정밀한 타격 지점을 실시간으로 계산함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Control-Theory]], [[Robotics-Foundations]], [[Probability-Theory]], [[Time-Series-Analysis]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Kalman-Filter-and-State-Tracking.md]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: MATH-KDE-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [statistics, math, kde, density-estimation, data-visualization, probability]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Kernel Density Estimation (KDE, 커널 밀도 추정)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터라는 개별 점들에 부드러운 산 모양의 확률을 씌워, 전체의 흐름을 보여주는 부드러운 능선을 그려라" — 유한한 표본 데이터를 바탕으로 모집단의 확률 밀도 함수(PDF)를 부드럽게 추정하여 데이터의 분포 특성을 파악하는 기계학습 및 통계학의 핵심 도구.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Smoothing and Summation" — 각 데이터 포인트 위치에 커널 함수(주로 가우시안)를 배치하고, 이들을 모두 합산하여 데이터가 밀집된 곳은 높게, 희소한 곳은 낮게 표현하는 공간적 밀도 추론 패턴.
|
||||
- **주요 구성 요소:**
|
||||
- **Kernel Function:** 데이터의 영향력을 주변으로 퍼뜨리는 함수 형태.
|
||||
- **Bandwidth ($h$):** 함수의 넓이(매끄러움)를 조절하는 파라미터. $h$가 너무 작으면 과적합(Overfitting), 너무 크면 분포가 뭉개짐(Underfitting).
|
||||
- **의의:** 히스토그램과 달리 빈(Bin)의 크기나 시작점에 민감하지 않으며, 데이터의 실제 분포 형태를 훨씬 더 정확하게 반영할 수 있음.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순한 시각화 도구로 여겨졌으나, 최근에는 이상치 탐지(Anomaly Detection)나 생성 모델(Generative Models)의 기초 이론으로 중요성이 다시 부각됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 응답 시간 분포를 분석하여 병목 구간을 시각화할 때, 히스토그램 대신 KDE 곡선을 사용하여 통계적 왜곡을 방지함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Probability-Theory]], [[Exploratory-Data-Analysis]], [[Anomaly-Detection-Foundations]], [[Supervised-Learning-Foundations]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Kernel-Density-Estimation-KDE.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: ML-SVM-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [machine-learning, svm, kernel-methods, optimization, classification, kernel-trick]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Kernel Methods and SVMs (커널 메서드와 SVM)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터를 더 높은 차원으로 끌어올려 복잡하게 얽힌 실타래를 한 칼에 베어버리는 최적의 경계선을 찾아라" — 데이터를 고차원 공간으로 매핑하여 비선형적인 관계를 선형적으로 분리 가능하게 만드는 '커널 트릭'과, 두 클래스 사이의 거리(Margin)를 최대화하는 'SVM'의 결합.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Max-Margin Hyperplane" — 단순히 클래스를 나누는 것을 넘어, 양측 데이터(Support Vectors)로부터 가장 멀리 떨어진 최적의 안전거리(Margin)를 확보하여 모델의 일반화 능력을 극대화하는 최적화 패턴.
|
||||
- **핵심 개념:**
|
||||
- **Support Vectors:** 결정 경계를 결정하는 가장 가까운 데이터 포인트들.
|
||||
- **Kernel Trick:** 실제로 차원을 높이지 않고도 고차원 내적 연산 효과를 내는 수학적 기법 (RBF, Polynomial Kernel 등).
|
||||
- **Slack Variables:** 일부 오차를 허용하여 노이즈에 강건하게 만드는 기법 (Soft Margin).
|
||||
- **의의:** 수학적으로 명확한 해(Global Optimum)를 보장하며, 데이터가 적은 상황에서도 딥러닝에 필적하는 강력한 성능을 발휘함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 모든 문제를 해결할 만능 알고리즘으로 추앙받았으나, 데이터 규모가 커질수록 연산량이 기하급수적으로 늘어나는 한계로 인해 대규모 데이터셋에서는 딥러닝에 자리를 내어줌.
|
||||
- **정책 변화:** Antigravity 프로젝트는 실시간 이상 징후 탐지 시, 데이터셋이 작고 경계가 명확해야 하는 특정 보안 도메인에서 One-class SVM을 적극적으로 활용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Supervised-Learning-Foundations]], [[Inner-Product-Spaces]], [[Dimensionality-Reduction]], [[Global-vs-Local-Optima]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Kernel-Methods-and-SVMs.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: AI-DISTILL-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [ai, deep-learning, knowledge-distillation, model-compression, inference-optimization]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Knowledge Distillation (지식 증류)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "거인의 방대한 지식을 요약하여 작은 아이의 머릿속에 효율적으로 이식하라" — 거대한 사전 학습 모델(Teacher)이 가진 정교한 예측 확률 분포를 작은 경량 모델(Student)이 학습하게 하여, 성능 손실을 최소화하면서 추론 속도를 비약적으로 높이는 기법.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Teacher-Student Learning" — 정답 레이블(Hard Target)뿐만 아니라, 티처 모델이 내놓은 각 클래스별 확률값(Soft Target)에 담긴 '클래스 간 상관관계' 정보까지 스튜던트 모델이 학습하게 하는 지식 전수 패턴.
|
||||
- **작동 원리:**
|
||||
- **Teacher Model:** 풍부한 파라미터를 가진 고성능 모델.
|
||||
- **Student Model:** 실전 배포를 위한 가벼운 모델.
|
||||
- **Temperature (T):** 소프트맥스 결과값을 부드럽게 만들어(Softening) 스튜던트 모델이 더 풍부한 정보를 배우게 함.
|
||||
- **의의:** 거대 모델의 뛰어난 일반화 능력을 유지하면서도 모바일이나 엣지 기기에서 실시간 구동 가능한 모델을 만들 수 있게 함 (예: BERT -> DistilBERT).
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순히 모델의 크기를 줄이는(Pruning, Quantization) 하드웨어적 접근을 넘어, 모델의 '사고 방식' 자체를 최적화하여 전수하는 알고리즘적 접근으로 진화.
|
||||
- **정책 변화:** Antigravity 프로젝트는 로컬 브레인용 경량 모델 제작 시, 클라우드 브레인의 거대 파라미터 모델을 티처로 삼아 지식 증류 과정을 거침으로써 소형 모델의 지능을 상향 평준화함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Inference-Optimization]], [[Transfer-Learning-Foundations]], [[LLM]], [[Hardware-Acceleration-for-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Knowledge-Distillation.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: DATA-KG-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [data-engineering, knowledge-graph, graph-database, semantic-web, ontology, rag]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Knowledge Graph Foundations (지식 그래프 기초)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터를 단순한 목록이 아닌 '관계의 그물망'으로 엮어, 기계가 세상의 맥락을 스스로 탐험하게 하라" — 개체(Entity)와 그들 사이의 관계(Relationship)를 그래프 구조로 표현하여, 의미론적 검색(Semantic Search)과 복합 추론을 가능케 하는 지식 베이스 아키텍처.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Triples (Subject-Predicate-Object)" — "A는 B와 C의 관계다"라는 세 부분의 조합을 기본 단위로 삼아, 파편화된 지식들을 거대한 의미망으로 연결하는 지식 정형화 패턴.
|
||||
- **주요 구성 요소:**
|
||||
- **Ontology:** 데이터의 개념과 분류 체계를 정의.
|
||||
- **Entities & Relations:** 실제 데이터(노드)와 그들의 연결(엣지).
|
||||
- **Graph Database:** Neo4j, ArangoDB 등 그래프 구조 저장 및 쿼리에 최적화된 엔진.
|
||||
- **의의:** 기존 검색 엔진이 찾지 못하는 '연관된 정보'를 즉각 추적할 수 있으며, 특히 환각 현상을 줄이기 위한 GraphRAG의 핵심 토대가 됨.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 정적인 백과사전식 지식에서 벗어나, 대규모 언어 모델(LLM)이 추출한 비정형 데이터의 관계를 실시간으로 통합하는 '동적 지식 그래프'로 진화.
|
||||
- **정책 변화:** Antigravity 프로젝트의 핵심 자산은 1,174개 문서 간의 유기적 연결 관계를 담은 `20_Meta/Graph.json`이며, 이를 통해 에이전트는 특정 주제에서 파생된 심화 지식을 막힘없이 탐색함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Graph-Theory-and-Networks]], [[GNN]], [[Information-Retrieval-IR]], [[Hallucination-in-LLMs]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Knowledge-Graph-Foundations.md]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: MATH-KOLM-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [math, computer-science, information-theory, kolmogorov-complexity, compression]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Kolmogorov Complexity (콜모고로프 복잡도)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터의 복잡도는 그 데이터를 설명하기 위해 필요한 '가장 짧은 문장'의 길이다" — 어떤 데이터를 생성할 수 있는 가장 짧은 알고리즘(프로그램)의 길이로 데이터의 정보량을 정의하는 이론적 척도.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Algorithmic Incompressibility" — 규칙적인 데이터는 짧은 프로그램으로 설명 가능하지만(낮은 복잡도), 완전 무작위(Random) 데이터는 데이터 그 자체를 출력하는 것 외에는 방법이 없어 데이터 길이만큼의 복잡도를 가진다는 패턴.
|
||||
- **주요 개념:**
|
||||
- **Minimum Description Length (MDL):** 데이터를 설명하는 모델의 복잡도와 모델로 데이터를 설명했을 때의 오차를 동시에 최소화하려는 원리.
|
||||
- **Universal Turing Machine:** 복잡도는 언어에 따라 상수로만 차이가 나며 본질적인 복잡도는 보존됨 (Invariance Theorem).
|
||||
- **의의:** 데이터 압축 기술의 이론적 상한선(Entropy)을 제공하며, 인공지능이 데이터를 '학습'한다는 것이 곧 데이터의 '가장 짧은 압축 알고리즘'을 찾는 과정임을 시사함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 이론적으로는 계산 불가능(Uncomputable)한 영역이지만, 실전에서는 신경망의 파라미터 수와 손실 함수의 관계를 분석하여 모델의 효율성을 측정하는 도구로 응용됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 지식 문서의 정보 밀도를 측정할 때, 의미론적 핵심 내용이 얼마나 함축적으로 표현되었는지 평가하는 척도 중 하나로 콜모고로프 복잡도 개념을 차용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Probability-Theory]], [[Information-Retrieval-IR]], [[Deep-Learning-Foundations]], [[Occams-Razor-in-ML]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Kolmogorov-Complexity.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: SYS-K8S-AI-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [infrastructure, kubernetes, ai-orchestration, mlops, gpu-scheduling, scalability]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Kubernetes for AI Orchestration (AI 오케스트레이션을 위한 쿠버네티스)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "서버의 군단을 코드 한 줄로 지휘하여, AI의 거대한 연산 부하를 빈틈없이 관리하라" — 컨테이너화된 AI 애플리케이션의 배포, 확장 및 관리를 자동화하고, 특히 희소 자원인 GPU를 효율적으로 할당/공유하게 해주는 분산 컴퓨팅 운영 플랫폼.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Declarative Infrastructure" — 인프라의 상태를 코드로 선언하면 시스템이 스스로 그 상태를 유지(Self-healing)하며, 동적으로 자원을 할당(Auto-scaling)하여 모델의 연산 요구량에 즉각 대응하는 자동화 패턴.
|
||||
- **AI 특화 기능:**
|
||||
- **GPU Scheduling:** 특정 파드(Pod)에 GPU 자원을 할당하고 모니터링.
|
||||
- **Job Orchestration:** 대규모 학습 작업을 여러 노드에 분산 배치하고 완료 후 자원 회수.
|
||||
- **Service Mesh:** 복잡하게 얽힌 AI 마이크로서비스 간의 통신과 보안 제어.
|
||||
- **의의:** 실험실 수준의 AI 모델을 수백만 사용자가 사용하는 엔터프라이즈 급 서비스로 확장하기 위한 필수 인프라(MLOps의 핵심).
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순 웹 서비스용으로 쓰이던 단계를 넘어, 이제는 Kubeflow나 Ray와 같은 프레임워크와 결합하여 AI 워크플로우 전체를 관리하는 전용 플랫폼으로 진화.
|
||||
- **정책 변화:** Antigravity 프로젝트의 클라우드 인프라는 쿠버네티스를 기반으로 설계되었으며, 에이전트의 부하가 급증할 경우 자동으로 컴퓨팅 노드를 확장하여 지연 없는 지식 서비스를 제공함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Infrastructure-as-Code-IaC]], [[DevOps-for-AI-MLOps]], [[System-Design-for-AI-Scale]], [[High-Availability-Systems]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Kubernetes-for-AI-Orchestration.md]]
|
||||
@@ -0,0 +1,31 @@
|
||||
---
|
||||
id: MATH-KL-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [math, statistics, kl-divergence, information-theory, loss-functions, ai]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Kullback-Leibler Divergence (KL 발산)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "두 세상(확률 분포) 사이의 어긋남을 측정하여, 모델이 진실에 얼마나 도달했는지 수치로 증명하라" — 어떤 확률 분포 $P$를 다른 확률 분포 $Q$로 대체했을 때 발생하는 정보 손실의 양을 측정하는 비대칭적 지표.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Distribution Alignment" — 모델의 출력 분포를 타겟 분포에 근사시키기 위해 정보 엔트로피의 차이를 최소화하며 지식의 왜곡을 줄여나가는 최적화 패턴.
|
||||
- **핵심 성질:**
|
||||
- **Non-negativity:** 항상 0 이상이며, 두 분포가 완벽히 같을 때만 0임 (Gibbs' Inequality).
|
||||
- **Asymmetry:** $D_{KL}(P||Q) \neq D_{KL}(Q||P)$. 즉, 기준이 되는 분포에 따라 값이 달라짐 (거리 개념이 아님).
|
||||
- **AI에서의 응용:**
|
||||
- **VAE (Variational Autoencoder):** 잠재 공간의 분포를 가우시안 분포에 가깝게 강제.
|
||||
- **PPO (Reinforcement Learning):** 새로운 정책이 이전 정책과 너무 급격하게 변하지 않도록 제약.
|
||||
- **Knowledge Distillation:** 스튜던트 모델이 티처 모델의 확률 분포를 따라가게 함.
|
||||
- **의의:** AI 모델이 단순히 정답을 맞히는 것을 넘어, 데이터의 내재된 확률 구조 자체를 학습하게 만드는 수학적 나침반.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 대칭적인 거리 개념(Euclidean Distance)으로 접근하던 초기 방식을 넘어, 정보의 흐름과 소실 관점에서 확률 분포를 비교하는 정보 이론적 접근이 현대 AI의 표준이 됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 페르소나 미세 조정(Fine-tuning) 시, 기존 모델과의 KL 발산을 모니터링하여 원래의 유용한 지능이 파괴되지 않도록 관리함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Probability-Theory]], [[Kolmogorov-Complexity]], [[Knowledge-Distillation]], [[Reinforcement-Learning]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Kullback-Leibler-Divergence.md]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: ML-REG-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [machine-learning, regularization, l1-norm, l2-norm, overfitting, optimization]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[L1 and L2 Regularization (L1 및 L2 정규화)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "모델의 욕심(Weight)에 벌점을 부여하여, 단순함의 미학으로 과적합(Overfitting)의 늪을 탈출하라" — 손실 함수에 가중치의 크기를 페널티로 추가하여, 모델이 특정 데이터에만 과도하게 맞춰지는 것을 방지하고 일반화 성능을 높이는 기법.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Weight Decay" — 가중치가 커질수록 전체 손실(Loss)을 증가시켜, 모델이 가능한 작은 가중치 값을 갖도록 유도함으로써 복잡도를 제어하는 수치적 억제 패턴.
|
||||
- **주요 유형:**
|
||||
- **L1 Regularization (Lasso):** 가중치의 절대값 합을 페널티로 부여. 중요하지 않은 가중치를 0으로 만들어 특징 선택(Feature Selection) 효과 발생.
|
||||
- **L2 Regularization (Ridge):** 가중치의 제곱 합을 페널티로 부여. 가중치를 전반적으로 작고 고르게 만들어 급격한 변화를 억제.
|
||||
- **의의:** 고차원 데이터에서 모델이 노이즈까지 학습하는 것을 방지하여, 실전에서 안정적인 예측 성능을 보장함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단순히 가중치를 줄이는 것만이 능사가 아니며, 데이터의 특성에 따라 L1과 L2를 결합한 Elastic Net이나 드롭아웃(Dropout) 등과 병행하여 최적의 균형점을 찾는 것이 현대 딥러닝의 표준.
|
||||
- **정책 변화:** Antigravity 프로젝트의 핵심 추론 모델들은 학습 시 과도한 가중치 쏠림을 방지하기 위해 L2 정규화를 기본 적용하며, 희소한 지식 특징을 추출해야 하는 모듈에는 L1 정규화를 전략적으로 사용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Supervised-Learning-Foundations]], [[Generalization-in-AI]], [[Hyperparameter-Optimization]], [[Loss-Functions-Foundations]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/L1-and-L2-Regularization.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: ML-ROBUST-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [machine-learning, label-noise, robustness, robust-learning, data-quality]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Label Noise and Robustness (레이블 노이즈와 강건성)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터의 거짓(Noise)에 현혹되지 말고, 다수의 일관된 증거 속에 숨겨진 진실된 패턴을 포착하라" — 훈련 데이터에 포함된 잘못된 레이블(정답)에도 불구하고, 모델이 일반화된 성능을 유지하며 실제 정답 분포를 올바르게 학습하게 만드는 기술.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Noise-tolerance" — 손실 함수를 수정하여 특정 오차에 둔감하게 만들거나, 신뢰할 수 없는 샘플의 비중을 낮추어 정제되지 않은 데이터로부터 핵심 정보를 추출하는 방어적 학습 패턴.
|
||||
- **주요 전략:**
|
||||
- **Robust Loss Functions:** 평균 제곱 오차(MSE)보다 이상치에 강한 절대 오차(MAE)나 후버 손실(Huber Loss) 사용.
|
||||
- **Sample Cleaning/Selection:** 모델이 확신을 가지지 못하는 샘플을 잠재적 노이즈로 판단하여 제거하거나 가중치를 낮춤.
|
||||
- **Label Smoothing:** 정답을 1.0이라는 절대적 수치 대신 0.9 정도로 완화하여 모델의 과도한 확신을 억제.
|
||||
- **의의:** 완벽한 레이블링이 불가능한 대규모 실제 데이터셋(웹 크롤링 등) 환경에서 안정적인 AI 시스템을 구축하기 위한 필수 조건.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 깨끗한 데이터만이 정답이라는 결벽증적 사고에서 벗어나, 노이즈 섞인 방대한 데이터가 소량의 정제 데이터보다 지능 향상에 더 기여할 수 있음을 입증하는 방향으로 연구가 전개됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 비정형 로우 데이터(`00_Raw`)에서 지식을 자동 추출할 때, 추출 엔진 간의 불일치를 노이즈로 간주하고 다수결 및 신뢰도 기반 필터링을 통해 지식의 무결성을 확보함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Loss-Functions-Foundations]], [[Unsupervised-Learning-Foundations]], [[Supervised-Learning-Foundations]], [[Generalization-in-AI]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Label-Noise-and-Robustness.md]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: MATH-LAGR-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [math, optimization, calculus, lagrange-multipliers, constrained-optimization]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Lagrange Multipliers (라그랑주 승수법)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "제약(Constraint)이라는 벽에 가로막혔을 때, 그 벽과 목표(Objective)가 만나는 가장 아름다운 접점을 찾아라" — 제약 조건이 있는 최적화 문제를 제약 조건이 없는 문제로 변환하여, 목적 함수의 경사도(Gradient)와 제약 함수의 경사도가 나란해지는 지점을 찾는 수학적 기법.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Gradient Alignment" — 목표 함수의 등고선과 제약 조건의 경계선이 서로 접할 때 최적해가 발생한다는 기하학적 통찰을 바탕으로, 라그랑주 승수($\lambda$)를 도입하여 통합 함수($L$)를 구성하는 최적화 패턴.
|
||||
- **핵심 원리:**
|
||||
- **Lagrangian Function:** $L(x, \lambda) = f(x) - \lambda(g(x) - c)$ 형태의 식을 구성.
|
||||
- **Stationary Point:** $L$을 각 변수에 대해 편미분하여 0이 되는 지점을 탐색.
|
||||
- **의의:** 기계학습의 수많은 최적화 문제(특히 제약 조건이 있는 SVM, 주성분 분석 등)를 해결하는 이론적 근거가 되며, 복잡한 현실의 제약 속에서 최선의 선택을 내리는 논리적 토대 제공.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 등식 제약 조건에만 머물던 고전적 방식에서, 부등식 제약 조건까지 포괄하는 KKT(Karush-Kuhn-Tucker) 조건으로 확장되어 현대 인공지능의 정교한 최적화 알고리즘에 적용됨.
|
||||
- **정책 변화:** Antigravity 프로젝트는 에이전트의 연산 자원(Token, Time) 제약 하에서 정보의 품질을 극대화하는 스케줄링 알고리즘 설계 시 라그랑주 승수법의 최적화 개념을 활용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Kernel-Methods-and-SVMs]], [[Global-vs-Local-Optima]], [[Deep-Learning-Foundations]], [[Search-Algorithms]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Lagrange-Multipliers.md]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: NLP-LDA-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [nlp, machine-learning, lda, topic-modeling, unsupervised-learning, probability]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Latent Dirichlet Allocation (LDA, 잠재 디리클레 할당)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "문서는 여러 주제의 혼합물이며, 각 주제는 특정 단어들의 모임이다. 이 보이지 않는 구조를 확률의 눈으로 투시하라" — 문서 집합에서 숨겨진 주제를 찾아내고, 각 문서가 어떤 주제들의 비중으로 구성되어 있는지 추론하는 생성적 확률 모델.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Generative Process Reverse" — 문서가 작성되는 과정을 "주제 선택 -> 단어 선택"이라는 확률적 시나리오로 가정하고, 거꾸로 관측된 단어들로부터 원래의 주제 분포를 역추론하는 비지도 학습 패턴.
|
||||
- **핵심 가정:**
|
||||
- **Bag-of-Words:** 단어의 순서는 무시하고 빈도만 고려.
|
||||
- **Dirichlet Distribution:** 문서별 주제 분포와 주제별 단어 분포가 디리클레 분포를 따른다고 가정.
|
||||
- **의의:** 사람이 일일이 읽지 않아도 수천만 건의 문서에서 주요 화두(Topic)를 자동으로 추출하여 지식을 체계화할 수 있게 함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 문맥을 무시하는 단어 빈도 중심의 한계를 넘기 위해, 최근에는 문장의 의미를 임베딩 벡터로 파악하는 BERT 기반의 토픽 모델링(BERTopic)과 결합하여 정밀도를 높이는 추세.
|
||||
- **정책 변화:** Antigravity 프로젝트는 `00_Raw`에 유입되는 대규모 텍스트 데이터를 1차 분류할 때 LDA를 활용하여 위키의 어떤 카테고리에 배정할지 결정하는 클러스터링 보조 도구로 사용함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Latent-Semantic-Analysis-LSA]], [[Unsupervised-Learning-Foundations]], [[NLP-Foundations]], [[Exploratory-Data-Analysis]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Latent-Dirichlet-Allocation.md]]
|
||||
@@ -0,0 +1,28 @@
|
||||
---
|
||||
id: NLP-LSA-001
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [nlp, lsa, svd, latent-semantics, dimensional-reduction, search-optimization]
|
||||
last_reinforced: 2026-04-26
|
||||
---
|
||||
|
||||
# [[Latent Semantic Analysis (LSA, 잠재 의미 분석)]]
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "서로 다른 단어라도 같은 의미를 품고 있다면, 고차원 수학의 눈(SVD)으로 그들을 한곳으로 모아라" — 단어-문서 행렬을 특이값 분해(SVD)하여 데이터의 차원을 축소하고, 이를 통해 단어들 사이에 숨겨진 잠재적인 의미 구조를 파악하는 기법.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **추출된 패턴:** "Semantic Noise Reduction" — 철자가 다르지만 의미가 비슷한 유의어 문제를 해결하기 위해, 중복되거나 중요도가 낮은 정보를 제거하고 핵심적인 '의미적 특징'만을 남기는 차원 축소 패턴.
|
||||
- **작동 원리:**
|
||||
- **Step 1:** 단어-문서 행렬(DTM) 생성.
|
||||
- **Step 2:** TF-IDF 등을 통해 단어의 가중치 조절.
|
||||
- **Step 3:** SVD를 수행하여 상위 K개의 특이값만 남기고 나머지 삭제 (차원 축소).
|
||||
- **의의:** 동의어(Synonymy) 문제를 효과적으로 처리할 수 있으며, 현대 임베딩 기술(Word2Vec 등)이 나오기 전까지 텍스트의 의미적 유사도를 측정하는 표준 기술로 군림함.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
|
||||
- **과거 데이터와의 충돌:** 단어의 순서를 무시하는 Bag-of-Words 기반의 한계와 새로운 데이터 추가 시 전체 행렬을 다시 분해해야 하는 비효율성으로 인해, 최근에는 신경망 기반의 벡터 임베딩 기술로 대체되는 추세.
|
||||
- **정책 변화:** Antigravity 프로젝트는 과거에 구축된 대규모 텍스트 아카이브를 빠르게 색인화하고 주제 간의 거대 지도를 시각화할 때, 연산 속도가 빠른 LSA를 초기 분석 도구로 병행함.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- [[Latent-Dirichlet-Allocation]], [[Dimensionality-Reduction]], [[Information-Retrieval-IR]], [[NLP-Foundations]]
|
||||
- **Raw Source:** [[10_Wiki/Topics/AI/Latent-Semantic-Analysis-LSA.md]]
|
||||
Reference in New Issue
Block a user