diff --git a/00_Raw/2026-04-26-Skybound_Combat_HUD_Information_Hierarchy_Onboarding.md b/00_Raw/2026-04-26-Skybound_Combat_HUD_Information_Hierarchy_Onboarding.md new file mode 100644 index 00000000..0ae38698 --- /dev/null +++ b/00_Raw/2026-04-26-Skybound_Combat_HUD_Information_Hierarchy_Onboarding.md @@ -0,0 +1,89 @@ +# Skybound Combat HUD Information Hierarchy Onboarding + +작성일: 2026-04-26 17:06 KST + +## 요청 요약 + +- 전투 HUD를 정보 패널이 아니라 플레이 보조 장치로 줄이는 방향으로 진행한다. +- 항상 보이는 정보는 최소화하고, Stage 1 초반에는 핵심 행동을 자연스럽게 안내하는 온보딩이 필요하다. + +## 핵심 판단 + +Skybound는 전술 시뮬레이션이 아니라 `Survivor-like horde survival shooter`에 가깝다. + +따라서 전투 중 HUD는 모든 정보를 보여주는 것이 아니라 다음 판단만 빠르게 도와야 한다. + +- 지금 몇 스테이지인가 +- 내 체력이 위험한가 +- Tactical Level이 얼마나 찼는가 +- 폭탄과 Lock-on을 쓸 수 있는가 +- 초반 사용자는 지금 무엇을 해야 하는가 + +점수, 베스트런, 세부 상태 정보는 전투 판단보다 결과/성장 확인에 더 적합하므로 전투 중 상시 노출에서 제외하는 것이 맞다. + +## 적용한 변경 + +### 전투 HUD 상시 정보 축소 + +기존에는 전투 중 HUD에서 점수/베스트런 같은 정보도 함께 노출되었다. + +변경: + +- `ScoreBoard`를 전투 HUD 상시 노출에서 제거 +- `Tactical Level` 라벨을 `Tac Level`로 축약 +- Mastery 상태는 전투 중 상시 HUD에서 숨김 +- 기존 Stage, HP, Tac Level, Bomb, Lock-on, 설정 버튼 중심으로 정리 + +의도: + +- 전투 화면을 덜 가리게 한다. +- 사용자의 시선을 생존과 성장 루프에 집중시킨다. +- 점수 확인은 결과 화면에서 더 명확하게 하도록 역할을 분리한다. + +### Stage 1 Flight Plan 카드 추가 + +Stage 1 초반에만 작은 목표 카드가 나타나도록 했다. + +목표 단계: + +- Move: WASD로 거리 유지 +- Collect: 청록 크리스탈과 안전 픽업 회수 +- Upgrade: Tac Level 상승 시 모듈 선택 +- Survive: 포위되면 Space Bomb 사용 + +표시 조건: + +- Stage 1 +- 전투 시작 후 약 75초 이내 +- Tactical Upgrade 선택 화면이 아닐 때 +- 아직 완료되지 않은 목표가 있을 때 + +의도: + +- 긴 튜토리얼 문장 대신 실제 플레이 중 해야 할 행동만 짧게 안내한다. +- 사용자가 시스템을 “읽어서” 배우는 것이 아니라 “하면서” 배우게 한다. +- 전투 흐름을 방해하지 않도록 작은 사이드 카드로 처리한다. + +### Desktop/Small 화면 배치 대응 + +Desktop에서는 기존 side dock 철학을 유지하고, Flight Plan 카드는 반대편 사이드 레일에 배치했다. + +작은 화면에서는 카드가 플레이 필드 밖에 나가지 않도록 상단 아래쪽에 배치된다. + +## 수정 파일 + +- `/Volumes/Data/project/Antigravity/Skybound/src/features/game/ui/HUDOverlay.tsx` +- `/Volumes/Data/project/Antigravity/Skybound/src/features/game/ui/HUDOverlay.css` + +## 검증 + +- `npm run build` 성공 +- 출력 디렉터리: `dist/42` + +## 후속 플레이테스트 체크 포인트 + +- 전투 중 HUD가 이전보다 덜 부담스럽게 느껴지는지 확인한다. +- Stage 1 초반 Flight Plan 카드가 플레이를 가리지 않는지 확인한다. +- 목표 카드가 너무 오래 남거나 너무 빨리 사라지지 않는지 확인한다. +- 점수/베스트런이 빠진 것이 전투 중 불편하지 않은지 확인한다. +- 결과 화면에서 점수 확인 역할이 충분히 보완되는지 확인한다. diff --git a/10_Wiki/Topics/AI/Modern-Website-Architecture.md b/10_Wiki/Topics/AI/Modern-Website-Architecture.md new file mode 100644 index 00000000..ca9db91f --- /dev/null +++ b/10_Wiki/Topics/AI/Modern-Website-Architecture.md @@ -0,0 +1,29 @@ +--- +id: WEB-ARCH-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [web-architecture, ux, performance, seo, core-web-vitals, billboard-model] +last_reinforced: 2026-04-26 +--- + +# [[Modern Website Architecture (현대 웹사이트 아키텍처)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "기술적 고성능(Engineering)과 전환 중심의 사용자 경험(UX)을 빌보드 모델로 통합하여, 밀리초 단위의 속도로 비즈니스의 생존력을 증명하라" — 코어 웹 바이탈(Core Web Vitals) 성능과 모바일 우선주의 디자인, 그리고 AI 검색 엔진 최적화가 완벽하게 결합된 현대적 웹 생태계 구조. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Integrated Performance and Conversion" — 과거의 디자인과 개발이 분리된 방식에서 벗어나, 데이터 기반의 레이아웃 이동 최소화와 서버 사이드 렌더링(SSR)을 통해 사용자 체감 속도와 검색 랭킹을 동시에 잡는 아키텍처 패턴. +- **핵심 요소:** + - **Billboard Model:** 정보 밀도를 낮추고 인지적 명확성을 높여 사용자의 시선을 논리적으로 안내하는 디자인 철학. + - **Technical Stack:** React/Next.js 기반의 동적 라우팅 및 최적화된 렌더링 방식 적용. + - **Visual Stability:** 모바일 우선(Mobile-first) 적응형 디자인과 시맨틱 HTML5를 통한 구조적 완성도 확보. + - **SEO & AI Accessibility:** 스키마 마크업(Schema Markup)을 활용하여 구글 및 AI 검색 엔진의 크롤링 효율 극대화. +- **의의:** 단순한 정보 전달을 넘어, 엄격한 성능 지표를 준수함으로써 사용자 이탈을 막고 비즈니스 전환율을 극대화하는 생존 전략. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 기능 중심의 헤더 구성을 선호하던 과거와 달리, 현대 아키텍처는 여백과 시각적 계층 구조를 통한 '인지적 명확성'을 더 높은 가치로 간주함. +- **정책 변화:** Antigravity 프로젝트는 모든 웹 기반 인터페이스 설계 시, `00_Raw`에 정의된 현대 웹 아키텍처 원칙을 준수하여 0.1초 이내의 인터랙션 반응성을 보장하는 것을 원칙으로 함. + +## 🔗 지식 연결 (Graph) +- [[Core-Web-Vitals]], [[SEO-Foundations]], [[Single-Page-Applications-SPA]], [[Mobile-First-Design]], [[User-Experience-UX-Design]] +- **Raw Source:** [[00_Raw/Modern Website Architecture.md]] diff --git a/10_Wiki/Topics/AI/Momentum-and-Optimization.md b/10_Wiki/Topics/AI/Momentum-and-Optimization.md new file mode 100644 index 00000000..f59616e3 --- /dev/null +++ b/10_Wiki/Topics/AI/Momentum-and-Optimization.md @@ -0,0 +1,28 @@ +--- +id: DL-OPT-MOM-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, optimization, momentum, gradient-descent, adam] +last_reinforced: 2026-04-26 +--- + +# [[Momentum and Optimization (모멘텀과 최적화)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "기울기의 관성(Velocity)을 이용하여 평탄한 길은 빠르게 주파하고, 웅덩이(Local Minima)는 과감하게 뛰어넘어라" — 경사 하강법에 물리적인 '운동량' 개념을 도입하여, 이전 업데이트의 방향과 속도를 현재 학습에 반영함으로써 수렴 속도를 높이고 최적화의 안정성을 확보하는 기법. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Accumulated Velocity and Smoothing" — 매 순간의 기울기 변화에 일일이 반응하여 진동하는 대신, 과거의 이동 궤적을 누적하여 진행 방향의 일관성을 유지함으로써 지그재그 현상을 억제하고 전역 최적해를 향해 전진하는 최적화 패턴. +- **주요 기법:** + - **Standard Momentum:** 과거 기울기의 가중 평균을 사용하여 현재 방향 결정. + - **Nesterov Accelerated Gradient (NAG):** 다음 단계의 예상 지점에서 기울기를 계산하여 '미리 보고' 조절하는 더 영리한 방식. + - **Adam (Adaptive Moment Estimation):** 모멘텀과 RMSProp(적응형 학습률)을 결합하여 현재 가장 널리 쓰이는 표준 최적화 알고리즘. +- **의의:** 딥러닝 모델의 복잡한 손실 함수 곡면에서 안장점(Saddle Point)이나 지역 최적해에 갇히는 문제를 물리적 원리로 해결함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 모멘텀이 항상 빠르다는 믿음에서 벗어나, 과도한 관성이 오히려 최적점을 지나쳐 버리는(Overshooting) 문제를 해결하기 위한 '감쇠(Damping)'와 '적응형 조절'의 중요성이 현대 최적화 이론의 핵심이 됨. +- **정책 변화:** Antigravity 프로젝트는 거대 언어 모델의 가중치 업데이트 시, 안정적인 수렴과 일반화 성능을 극대화하기 위해 AdamW(가중치 감쇠가 포함된 Adam)와 적절한 모멘텀 계수(0.9)를 기본값으로 사용함. + +## 🔗 지식 연결 (Graph) +- [[Gradient-Descent-Foundations]], [[Hyperparameter-Optimization]], [[Global-vs-Local-Optima]], [[Deep-Learning-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Momentum-and-Optimization.md]] diff --git a/10_Wiki/Topics/AI/Monte-Carlo-Integration.md b/10_Wiki/Topics/AI/Monte-Carlo-Integration.md new file mode 100644 index 00000000..c451c374 --- /dev/null +++ b/10_Wiki/Topics/AI/Monte-Carlo-Integration.md @@ -0,0 +1,28 @@ +--- +id: MATH-MC-INT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [math, statistics, monte-carlo, integration, sampling, numerical-analysis] +last_reinforced: 2026-04-26 +--- + +# [[Monte Carlo Integration (몬테카를로 적분)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "해석적으로 풀 수 없는 복잡한 영역의 넓이를 무작위 샘플링의 통계적 평균으로 정복하라" — 함수의 적분값을 구하기 위해 영역 내에서 무작위 점을 추출하고, 그 점들의 함숫값 평균을 통해 전체 적분량을 근사적으로 계산하는 수치 해석 기법. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Statistical Approximation of Continuous Space" — 연속적인 공간 전체를 계산하는 대신, 대표적인 샘플들을 충분히 많이 추출하면 그 평균이 실제 값에 수렴한다는 대수의 법칙을 활용하여 '차원의 저주'를 극복하는 적분 패턴. +- **수식적 원리:** $I = \int f(x) dx \approx \frac{V}{N} \sum_{i=1}^N f(x_i)$. 여기서 $V$는 영역의 부피, $N$은 샘플 수. +- **주요 특징:** + - **Dimension Independence:** 차원이 높아져도 샘플링 기반이기에 연산 복잡도가 지수적으로 증가하지 않음. + - **Probabilistic Accuracy:** 샘플 수가 늘어날수록 실제 값에 확률적으로 수렴하며, 오차 범위를 통계적으로 추정 가능. +- **의의:** 베이지안 추론, 강화학습의 기댓값 계산, 레이 트레이싱(Ray Tracing) 그래픽스 연산 등 현대 과학 계산의 핵심 근간. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 샘플링의 무작위성 때문에 결과가 매번 미세하게 달라질 수 있다는 단점이 있으나, 중요도 샘플링(Importance Sampling)이나 준-몬테카를로(Quasi-Monte Carlo) 기법을 통해 분산을 줄이고 수렴 속도를 높이는 방향으로 진화함. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 불확실한 보상 기대치를 계산하거나 대규모 지식 그래프의 잠재적 연결 강도를 추정할 때, 몬테카를로 적분 원리를 기반으로 한 시뮬레이션을 수행함. + +## 🔗 지식 연결 (Graph) +- [[Markov-Chain-Monte-Carlo]], [[Probability-Theory]], [[Monte-Carlo-Tree-Search-MCTS]], [[Bayesian-Inference]] +- **Raw Source:** [[10_Wiki/Topics/AI/Monte-Carlo-Integration.md]] diff --git a/10_Wiki/Topics/AI/Monte-Carlo-Tree-Search-MCTS.md b/10_Wiki/Topics/AI/Monte-Carlo-Tree-Search-MCTS.md new file mode 100644 index 00000000..0d14f7fe --- /dev/null +++ b/10_Wiki/Topics/AI/Monte-Carlo-Tree-Search-MCTS.md @@ -0,0 +1,29 @@ +--- +id: ALGO-MCTS-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [algorithm, ai, search, mcts, alphago, reinforcement-learning, game-theory] +last_reinforced: 2026-04-26 +--- + +# [[Monte Carlo Tree Search (MCTS, 몬테카를로 트리 탐색)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "모든 가능성을 뒤지는 대신, 승산 있는 길을 무작위로 끝까지 가보고 최선의 선택지를 역으로 추적하라" — 방대한 탐색 공간에서 유망한 경로를 선택하고 무작위 시뮬레이션을 통해 가치를 평가하여 최적의 의사결정을 내리는 지능형 탐색 알고리즘. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Exploitation vs Exploration in Search" — 이미 검증된 좋은 수(Exploitation)와 아직 가보지 않은 새로운 가능성(Exploration) 사이의 균형을 UCB1 수식을 통해 조절하며 트리를 확장해 나가는 지능형 탐색 패턴. +- **4단계 프로세스:** + - **Selection:** 루트에서 시작하여 UCB1 값이 가장 높은 자식 노드를 따라 내려감. + - **Expansion:** 탐색되지 않은 새로운 자식 노드를 트리에 추가. + - **Simulation (Rollout):** 해당 노드에서 게임의 끝까지 무작위로 진행하여 승패(보상) 확인. + - **Backpropagation:** 시뮬레이션 결과를 경로상의 모든 부모 노드에 업데이트하여 가치 갱신. +- **의의:** 휴리스틱 함수 없이도 복잡한 게임의 최적해를 찾을 수 있게 하여, 알파고를 포함한 현대 보드게임 AI 및 로봇 경로 계획의 핵심 기술이 됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 완전한 무작위 시뮬레이션에 의존하던 초기 방식에서, 이제는 신경망(Policy/Value Network)을 결합하여 시뮬레이션의 정확도와 탐색 효율을 극적으로 높인 'Deep MCTS'가 표준이 됨. +- **정책 변화:** Antigravity 에이전트의 복잡한 문제 해결 시나리오(예: 다단계 코드 리팩토링 경로 탐색) 시, 각 단계의 잠재적 리스크와 이득을 평가하기 위해 MCTS 기반의 의사결정 시뮬레이션을 활용함. + +## 🔗 지식 연결 (Graph) +- [[Markov-Decision-Process-MDP]], [[Reinforcement-Learning]], [[Monte-Carlo-Integration]], [[Search-Algorithms]], [[Game-Theory]] +- **Raw Source:** [[10_Wiki/Topics/AI/Monte-Carlo-Tree-Search-MCTS.md]] diff --git a/10_Wiki/Topics/AI/Multi-Agent-Reinforcement-Learning.md b/10_Wiki/Topics/AI/Multi-Agent-Reinforcement-Learning.md new file mode 100644 index 00000000..10882995 --- /dev/null +++ b/10_Wiki/Topics/AI/Multi-Agent-Reinforcement-Learning.md @@ -0,0 +1,27 @@ +--- +id: RL-MARL-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, reinforcement-learning, multi-agent, marl, game-theory, coordination] +last_reinforced: 2026-04-26 +--- + +# [[Multi-Agent Reinforcement Learning (MARL, 다중 에이전트 강화학습)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "개별 에이전트의 이기심을 넘어 집단의 하모니를 구축하고, 상호작용의 역동성 속에서 창발적 지능을 발현하라" — 여러 개의 독립적인 학습 주체(Agents)가 동일한 환경에서 동시에 학습하며 서로 협력하거나 경쟁하여 목표를 달성하는 강화학습 체계. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Co-evolution and Joint Strategy" — 한 에이전트의 행동이 다른 에이전트의 보상과 환경을 변화시키는 '비정적인(Non-stationary)' 환경 문제를 해결하기 위해, 상대의 행동을 예측하고 공동의 목표나 내시 균형(Nash Equilibrium)을 찾아가는 진화적 학습 패턴. +- **핵심 아키텍처:** + - **Independent Learning:** 각 에이전트가 타인을 환경의 일부로 보고 독립적으로 학습. + - **Centralized Training, Decentralized Execution (CTDE):** 학습은 중앙에서 모든 정보를 모아 정교하게 수행하고, 실행은 각자 독립적인 네트워크로 수행하는 현대적 표준 방식. +- **의의:** 군집 로봇 제어, 자율주행 차량 간 통신, 주식 시장 시뮬레이션 등 실세계의 복잡한 다자간 상호작용 문제를 해결하기 위한 필수 기술. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 에이전트 수가 늘어날수록 탐색 공간이 기하급수적으로 폭증하는 문제를 해결하기 위해, 최근에는 에이전트 간의 '소통(Communication)' 프로토콜을 스스로 학습하게 하거나 그래프 신경망(GNN)을 결합하여 관계를 모델링하는 방향으로 진화. +- **정책 변화:** Antigravity 프로젝트는 여러 협업 AI(Planning Agent, Coding Agent, Review Agent 등)가 상호작용하며 하나의 작업을 완료할 때, 최적의 협업 효율을 도출하기 위해 MARL 기반의 워크플로우 최적화를 연구함. + +## 🔗 지식 연결 (Graph) +- [[Reinforcement-Learning]], [[Game-Theory]], [[Monte-Carlo-Tree-Search-MCTS]], [[Graph-Neural-Networks-GNN]] +- **Raw Source:** [[10_Wiki/Topics/AI/Multi-Agent-Reinforcement-Learning.md]] diff --git a/10_Wiki/Topics/AI/Multi-Head-Attention-Mechanism.md b/10_Wiki/Topics/AI/Multi-Head-Attention-Mechanism.md new file mode 100644 index 00000000..ab4e2d23 --- /dev/null +++ b/10_Wiki/Topics/AI/Multi-Head-Attention-Mechanism.md @@ -0,0 +1,28 @@ +--- +id: DL-TR-MHA-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, transformer, multi-head-attention, self-attention, nlp] +last_reinforced: 2026-04-26 +--- + +# [[Multi-Head Attention Mechanism (멀티 헤드 어텐션 메커니즘)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "정보의 바다를 한 쌍의 눈이 아닌, 서로 다른 관점을 가진 여러 개의 눈으로 동시에 주시하여 입체적인 문맥을 완성하라" — 입력 데이터를 여러 개의 독립적인 하위 공간(Subspaces)으로 투영하여 다양한 관계 정보를 병렬적으로 학습하고 통합하는 트랜스포머 아키텍처의 핵심 메커니즘. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Parallel Diverse Representation" — 단일 어텐션이 가진 편향성을 극복하기 위해, 가중치 행렬을 여러 뭉치(Heads)로 나누어 각 헤드가 문법적 관계, 의미적 관계, 장거리 의존성 등 서로 다른 특징에 집중하게 만든 후 이를 다시 합쳐(Concatenate) 풍부한 표현력을 확보하는 패턴. +- **작동 원리:** + - **Linear Projection:** 입력 벡터를 $h$개의 다른 가중치로 투영하여 쿼리(Q), 키(K), 값(V) 생성. + - **Scaled Dot-Product Attention:** 각 헤드별로 독립적인 어텐션 스코어 계산. + - **Concat & Linear:** 모든 헤드의 결과를 이어 붙이고 최종 선형 변환을 통해 차원 유지. +- **의의:** 문맥의 중의성을 해소하고 문장 내 복잡한 상호작용을 한 번에 파악할 수 있게 하여, NLP를 넘어 비전, 오디오 등 모든 AI 도메인의 표준 추론 방식으로 정착됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 헤드가 많을수록 무조건 좋다는 통념에서 벗어나, 특정 헤드가 중복된 정보를 학습하거나 중요도가 낮은 헤드가 존재할 수 있음이 밝혀져, 최근에는 헤드별 가중치를 조절하거나 가지치기(Pruning)하는 기술도 연구됨. +- **정책 변화:** Antigravity 프로젝트의 핵심 추론 엔진은 지식 문서의 구조적 계층과 텍스트의 의미적 연결을 동시에 포착하기 위해 최적화된 8개 이상의 멀티 헤드 어텐션 레이어를 운용함. + +## 🔗 지식 연결 (Graph) +- [[Transformer-Architecture-Foundations]], [[Self-Attention-Foundations]], [[GPT-Architecture-Foundations]], [[BERT-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Multi-Head-Attention-Mechanism.md]] diff --git a/10_Wiki/Topics/AI/Multi-Modal-Learning.md b/10_Wiki/Topics/AI/Multi-Modal-Learning.md new file mode 100644 index 00000000..bf1e3ad4 --- /dev/null +++ b/10_Wiki/Topics/AI/Multi-Modal-Learning.md @@ -0,0 +1,28 @@ +--- +id: AI-MODAL-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, multi-modal, clip, dall-e, cross-modal-learning] +last_reinforced: 2026-04-26 +--- + +# [[Multi-Modal Learning (멀티모달 학습)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "언어의 개념과 이미지의 형상을 하나의 공통된 공간(Latent Space)에서 융합하여, 보고 듣고 말하는 통합 지능을 완성하라" — 텍스트, 이미지, 오디오, 비디오 등 서로 다른 형식의 데이터를 동시에 학습하여 모달리티 간의 상관관계를 파악하고 상호 변환하는 학습 체계. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Cross-modal Embedding Alignment" — 이미지에서 추출한 특징 벡터와 텍스트에서 추출한 특징 벡터가 같은 의미를 가질 때 가깝게 위치하도록 학습시킴으로써, 기계가 "사과"라는 단어와 사과의 시각적 형상을 동일한 개념으로 인지하게 만드는 패턴. +- **주요 구현 방식:** + - **Early Fusion:** 입력 단계에서 데이터를 물리적으로 결합. + - **Late Fusion:** 각 모달리티를 개별 모델로 처리한 후 결과 단계에서 통합. + - **Joint Training (CLIP 등):** 공유된 잠재 공간에서 두 데이터를 직접 비교하며 학습. +- **의의:** AI가 단순히 글자만 읽는 수준을 넘어, 현실 세계의 다채로운 정보를 인간처럼 복합적으로 이해하고 생성(Generative AI)할 수 있게 함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 모달리티 간의 단순 결합이 정보의 노이즈를 키울 수 있다는 우려를 넘어, 최근에는 서로 다른 감각 정보가 보완 작용을 하여 단일 모달리티보다 더 강력한 일반화 성능을 낼 수 있음이 증명됨 (GPT-4o 등). +- **정책 변화:** Antigravity 프로젝트는 에이전트가 코드 설명뿐만 아니라 아키텍처 다이어그램(Image)과 사용자의 음성 지시(Audio)를 동시에 해석할 수 있도록 멀티모달 추론 레이어를 확장 중임. + +## 🔗 지식 연결 (Graph) +- [[Transformer-Architecture-Foundations]], [[Computer-Vision-Foundations]], [[NLP-Foundations]], [[Generative-Adversarial-Networks-GAN]] +- **Raw Source:** [[10_Wiki/Topics/AI/Multi-Modal-Learning.md]] diff --git a/10_Wiki/Topics/AI/Multi-armed-Bandit-Problem.md b/10_Wiki/Topics/AI/Multi-armed-Bandit-Problem.md new file mode 100644 index 00000000..80d9da26 --- /dev/null +++ b/10_Wiki/Topics/AI/Multi-armed-Bandit-Problem.md @@ -0,0 +1,28 @@ +--- +id: RL-MAB-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, reinforcement-learning, multi-armed-bandit, exploration-exploitation, optimization] +last_reinforced: 2026-04-26 +--- + +# [[Multi-armed Bandit Problem (다중 슬롯머신 문제)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "최선의 보상을 주는 슬롯머신을 찾기 위해, 익숙한 기계를 당길 것인가(Exploit) 아니면 새로운 기계에 도전할 것인가(Explore)의 균형을 잡아라" — 제한된 자원으로 최대의 이익을 얻기 위해 탐색과 활용 사이의 딜레마를 해결하는 가장 기초적인 순차적 의사결정 모델. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Dynamic Allocation under Uncertainty" — 어떤 선택지가 가장 좋은지 모르는 상태에서, 데이터를 수집하며 점진적으로 더 유망한 선택지에 자원을 집중 투입하여 후회(Regret)를 최소화하는 패턴. +- **주요 알고리즘:** + - **$\epsilon$-Greedy:** 대부분은 가장 좋은 것을 선택하되, 아주 낮은 확률($\epsilon$)로 새로운 시도를 함. + - **UCB (Upper Confidence Bound):** 보상의 불확실성(분산)이 높은 선택지에 보너스를 주어 탐색 유도. + - **Thompson Sampling:** 확률 분포(베이지안)를 기반으로 샘플링하여 선택. +- **의의:** 추천 시스템의 A/B 테스트 최적화, 신약 임상 실험, 온라인 광고 노출 제어 등 실시간 피드백이 중요한 비즈니스 의사결정의 핵심 도구. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 '가장 높은 평균'을 찾는 것을 넘어, 이제는 시간에 따라 보상 확률이 변하는 비정적(Non-stationary) 환경이나 문맥 정보(Contextual Bandit)를 활용하는 방향으로 지능화됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트가 여러 도구(Tool) 중 현재 문제 해결에 가장 적합한 도구를 선택할 때, 과거 성공률을 기반으로 한 톰슨 샘플링 기법을 적용하여 최적의 도구 활용 전략을 수립함. + +## 🔗 지식 연결 (Graph) +- [[Reinforcement-Learning]], [[Monte-Carlo-Tree-Search-MCTS]], [[Expected-Utility-Theory]], [[A-B-Testing-Optimization]] +- **Raw Source:** [[10_Wiki/Topics/AI/Multi-armed-Bandit-Problem.md]] diff --git a/10_Wiki/Topics/AI/Multilayer-Perceptron-MLP.md b/10_Wiki/Topics/AI/Multilayer-Perceptron-MLP.md new file mode 100644 index 00000000..8e2ce685 --- /dev/null +++ b/10_Wiki/Topics/AI/Multilayer-Perceptron-MLP.md @@ -0,0 +1,29 @@ +--- +id: DL-MLP-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, mlp, neural-networks, backpropagation, foundations] +last_reinforced: 2026-04-26 +--- + +# [[Multilayer Perceptron (MLP, 다층 퍼셉트론)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "단순한 선형적 판단을 넘어, 비선형의 층(Hidden Layers)을 쌓아 세상의 복잡한 비논리를 논리적으로 해체하라" — 여러 개의 퍼셉트론 레이어를 쌓고 비선형 활성화 함수를 결합하여 임의의 복잡한 함수를 근사할 수 있는 가장 기본적인 심층 신경망 구조. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Hierarchical Feature Extraction" — 입력 데이터를 은닉층을 거치며 더 추상적이고 고차원적인 특징으로 변환하여, 선형 분리가 불가능한 복잡한 경계면을 학습하는 딥러닝의 원형적 패턴. +- **핵심 구성:** + - **Input Layer:** 외부 데이터를 수용하는 관문. + - **Hidden Layers:** 데이터의 숨겨진 패턴을 추출하는 비선형 연산 층. + - **Output Layer:** 최종 판단 결과를 내놓는 층. + - **Fully Connected:** 모든 뉴런이 이전 층의 모든 뉴런과 연결된 구조. +- **의의:** 퍼셉트론의 한계(XOR 문제)를 극복하고 역전파(Backpropagation) 알고리즘과 결합하여 현대 인공신경망의 부흥을 이끈 결정적 토대. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** MLP만으로 모든 데이터를 처리하려던 방식에서, 데이터의 특성에 최적화된 CNN(이미지)이나 RNN/Transformer(언어) 등으로 전문화되었으나, 여전히 모든 모델의 마지막 의사결정 레이어(Classification Head)에는 MLP 구조가 핵심적으로 사용됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 상황 판단 모듈이나 가벼운 특징 분류기 설계 시, 구조적 단순함과 범용성을 갖춘 MLP 아키텍처를 우선적으로 활용함. + +## 🔗 지식 연결 (Graph) +- [[Deep-Learning-Foundations]], [[Backpropagation-Foundations]], [[Activation-Functions]], [[Softmax-Regression-and-Classification]] +- **Raw Source:** [[10_Wiki/Topics/AI/Multilayer-Perceptron-MLP.md]] diff --git a/10_Wiki/Topics/AI/Multinomial-Naive-Bayes.md b/10_Wiki/Topics/AI/Multinomial-Naive-Bayes.md new file mode 100644 index 00000000..9d80c69d --- /dev/null +++ b/10_Wiki/Topics/AI/Multinomial-Naive-Bayes.md @@ -0,0 +1,28 @@ +--- +id: ML-MNB-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [machine-learning, nlp, naive-bayes, text-classification, statistics, bayesian] +last_reinforced: 2026-04-26 +--- + +# [[Multinomial Naive Bayes (다항 나이브 베이즈)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "단어의 빈도 속에 숨겨진 확률의 힘을 믿고, 복잡한 문맥 대신 통계적 정직함으로 문서를 분류하라" — 각 특징(단어 빈도)이 다항 분포를 따른다고 가정하고, 베이즈 정리를 활용하여 문서의 카테고리를 예측하는 텍스트 마이닝의 고전적 베이스라인 알고리즘. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Word Frequency Likelihood" — 문장을 단순히 단어의 뭉치(Bag-of-Words)로 보고, 특정 클래스에서 해당 단어들이 나타날 조건부 확률을 결합하여 가장 높은 사후 확률을 가진 클래스를 선택하는 패턴. +- **주요 특징:** + - **Efficiency:** 연산량이 매우 적어 대규모 텍스트 데이터를 순식간에 처리 가능. + - **Robustness to Small Data:** 데이터가 적을 때도 나이브 베이즈 특유의 '강한 가정' 덕분에 비교적 안정적인 성능 발휘. + - **Laplace Smoothing:** 한 번도 나오지 않은 단어 때문에 확률이 0이 되는 현상을 방지하는 필수 기법 적용. +- **의의:** 딥러닝 시대 이전까지 스팸 필터링, 뉴스 분류 등 텍스트 처리의 표준이었으며, 현재도 복잡한 모델을 돌리기 전 성능의 기준점(Baseline)으로 널리 활용됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단어 간의 독립성을 가정(Naive)하기 때문에 문맥이나 단어 순서를 무시한다는 치명적 단점이 있으나, 실제 텍스트 분류 환경에서는 이 단순함이 오히려 강력한 일반화 성능을 제공하는 '나이브 베이즈의 역설'이 종종 발생함. +- **정책 변화:** Antigravity 프로젝트는 수집된 원시 데이터(Raw Data)를 1차적으로 빠르게 카테고리화하거나, 키워드 기반의 의도 분류를 수행할 때 비용 대비 효율이 극대화된 다항 나이브 베이즈 모델을 활용함. + +## 🔗 지식 연결 (Graph) +- [[Naive-Bayes-Classifiers]], [[NLP-Foundations]], [[Probability-Theory]], [[Supervised-Learning-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Multinomial-Naive-Bayes.md]] diff --git a/10_Wiki/Topics/AI/Multivariate-Analysis.md b/10_Wiki/Topics/AI/Multivariate-Analysis.md new file mode 100644 index 00000000..6f9ce66f --- /dev/null +++ b/10_Wiki/Topics/AI/Multivariate-Analysis.md @@ -0,0 +1,29 @@ +--- +id: MATH-MVA-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [statistics, math, multivariate-analysis, pca, mva, data-science] +last_reinforced: 2026-04-26 +--- + +# [[Multivariate Analysis (다변량 분석)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "단일 변수의 관찰을 넘어, 변수들 사이의 복잡한 얽힘과 상호작용 속에서 데이터의 진짜 형상을 발견하라" — 둘 이상의 변수가 동시에 가지는 통계적 특성과 상관관계를 분석하여, 데이터 내의 숨겨진 패턴이나 구조를 파악하는 통계적 방법론의 총칭. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Dimensionality Reduction and Structural Discovery" — 변수들 사이의 공분산(Covariance)과 상관계수를 분석하여, 데이터의 흩어짐을 가장 잘 설명하는 주성분을 찾거나(PCA) 유사한 집단으로 묶는(Clustering) 등 고차원 데이터를 저차원의 핵심 구조로 요약하는 패턴. +- **주요 기법:** + - **PCA (주성분 분석):** 데이터의 분산을 최대한 보존하며 차원 축소. + - **Factor Analysis (요인 분석):** 관측된 변수들 뒤에 숨겨진 잠재 요인 추출. + - **MANOVA (다변량 분산 분석):** 여러 종속 변수에 대한 집단 간 차이 검정. + - **Canonical Correlation:** 두 변수 집단 사이의 상관관계 최대화. +- **의의:** 변수가 수백, 수천 개에 달하는 현대 빅데이터 환경에서 데이터의 중복성을 제거하고 핵심적인 인사이트를 도출하기 위한 필수적인 통계적 토대. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 선형적인 관계 분석에 치중하던 과거와 달리, 이제는 커널 기법이나 오토인코더(Autoencoder)와 같은 신경망 기술과 결합하여 비선형적인 다변량 관계까지 정밀하게 포착하는 방향으로 진화함. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 다양한 성능 지표(응답 속도, 정확도, 토큰 사용량 등) 사이의 복합적인 상관관계를 분석하여 전체적인 시스템 효율을 최적화할 때 다변량 분석 기법을 활용함. + +## 🔗 지식 연결 (Graph) +- [[Principal-Component-Analysis-PCA]], [[Linear-Discriminant-Analysis]], [[Exploratory-Data-Analysis]], [[Correlation-vs-Causality]] +- **Raw Source:** [[10_Wiki/Topics/AI/Multivariate-Analysis.md]] diff --git a/10_Wiki/Topics/AI/Mutual-Information.md b/10_Wiki/Topics/AI/Mutual-Information.md new file mode 100644 index 00000000..7e97c88a --- /dev/null +++ b/10_Wiki/Topics/AI/Mutual-Information.md @@ -0,0 +1,29 @@ +--- +id: MATH-MI-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [math, information-theory, mutual-information, entropy, machine-learning, feature-selection] +last_reinforced: 2026-04-26 +--- + +# [[Mutual Information (상호 정보량)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "두 변수가 공유하고 있는 정보의 양을 측정하여, 하나를 알 때 다른 하나에 대한 불확실성이 얼마나 사라지는지 수치화하라" — 두 확률 변수 사이의 상호 의존성을 측정하는 지표로, 단순한 선형 관계를 넘어 비선형적인 연관성까지 모두 포착할 수 있는 정보 이론적 척도. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Uncertainty Reduction" — 변수 $X$를 관찰함으로써 변수 $Y$의 엔트로피(불확실성)가 얼마나 감소하는지 계산하여, 두 변수가 얼마나 밀접하게 얽혀 있는지 파악하는 패턴. +- **수식적 정의:** $I(X; Y) = H(X) + H(Y) - H(X, Y)$ (각자의 엔트로피 합에서 결합 엔트로피를 뺀 값). +- **주요 특징:** + - **Non-linear Correlation:** 상관계수가 0이라도 상호 정보량은 높을 수 있음 (비선형적 관계 포착 가능). + - **Symmetry:** $I(X; Y) = I(Y; X)$. + - **Non-negativity:** 항상 0 이상의 값을 가지며, 0인 경우 두 변수는 독립임. +- **의의:** 머신러닝의 특징 선택(Feature Selection), 데이터 압축, 베이지안 네트워크 구축, 독립 성분 분석(ICA) 등에서 핵심적인 판단 기준으로 활용됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 연속형 변수에서 상호 정보량을 계산할 때 구간 분할(Binning) 방식에 따라 값이 왜곡될 수 있다는 한계가 있어, 최근에는 KNN 기반의 KSG 추정기나 MINE(Mutual Information Neural Estimation) 등 신경망 기반 추정 기법이 주로 사용됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 지식 임베딩 품질을 평가할 때, 입력 텍스트와 추출된 핵심 개념 사이의 상호 정보량을 측정하여 정보 손실을 최소화하는 지표로 활용함. + +## 🔗 지식 연결 (Graph) +- [[Kullback-Leibler-Divergence]], [[Independent-Component-Analysis]], [[Feature-Selection-Strategies]], [[Probability-Theory]] +- **Raw Source:** [[10_Wiki/Topics/AI/Mutual-Information.md]] diff --git a/10_Wiki/Topics/AI/NVIDIA-CUDA-and-AI.md b/10_Wiki/Topics/AI/NVIDIA-CUDA-and-AI.md new file mode 100644 index 00000000..a1f93906 --- /dev/null +++ b/10_Wiki/Topics/AI/NVIDIA-CUDA-and-AI.md @@ -0,0 +1,29 @@ +--- +id: HW-CUDA-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [hardware, gpu, nvidia, cuda, parallel-computing, deep-learning-acceleration] +last_reinforced: 2026-04-26 +--- + +# [[NVIDIA CUDA and AI (NVIDIA CUDA와 AI)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "그래픽을 그리는 수천 개의 작은 엔진들을 수학 연산의 노예로 부려, 딥러닝이라는 거대한 숫자의 성을 쌓아라" — NVIDIA가 개발한 병렬 컴퓨팅 플랫폼이자 프로그래밍 모델로, GPU의 강력한 병렬 처리 능력을 범용 계산(GPGPU)에 활용하여 AI 학습 속도를 수백 배 가속화하는 기술적 근간. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Massive Parallel Data Processing" — 수조 번의 행렬 곱셈이 필요한 신경망 연산을 CPU의 소수 고성능 코어 대신, GPU의 수천 개 저성능 코어에 잘게 쪼개어 동시에 할당함으로써 연산 처리량(Throughput)을 극대화하는 패턴. +- **주요 구성 요소:** + - **CUDA Cores:** 실제 연산을 수행하는 물리적 단위. + - **Kernel:** GPU에서 실행되는 병렬 함수. + - **Shared Memory:** 데이터 접근 속도를 높이기 위한 고속 메모리 계층. + - **cuDNN:** 딥러닝을 위해 최적화된 CUDA 기반 프리미티브 라이브러리 (합성곱, 활성화 함수 등). +- **의의:** AI 모델의 규모가 기하급수적으로 커질 수 있게 만든 일등 공신이며, 현대 모든 딥러닝 프레임워크(PyTorch, TensorFlow 등)의 실질적인 하드웨어 가속 표준. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 '더 많은 코어'가 정답이던 시대를 지나, 이제는 AI 연산에 특화된 텐서 코어(Tensor Cores)와 부동소수점 연산 정밀도 조절(Mixed Precision)이 성능 최적화의 핵심으로 부상함. +- **정책 변화:** Antigravity 프로젝트는 대규모 지식 인덱싱 및 에이전트 브레인 최적화 시, CUDA 스트림을 활용한 비동기 데이터 전송 기술을 적용하여 GPU 점유율을 95% 이상으로 유지함. + +## 🔗 지식 연결 (Graph) +- [[GPU-Architecture-for-AI]], [[Hardware-Acceleration-for-AI]], [[Matrix-Operations-and-AI]], [[PyTorch-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/NVIDIA-CUDA-and-AI.md]] diff --git a/10_Wiki/Topics/AI/Naive-Bayes-Classifiers.md b/10_Wiki/Topics/AI/Naive-Bayes-Classifiers.md new file mode 100644 index 00000000..694f12e4 --- /dev/null +++ b/10_Wiki/Topics/AI/Naive-Bayes-Classifiers.md @@ -0,0 +1,28 @@ +--- +id: ML-NB-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [machine-learning, naive-bayes, classification, bayesian, probability, nlp] +last_reinforced: 2026-04-26 +--- + +# [[Naive Bayes Classifiers (나이브 베이즈 분류기)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "특징들 사이의 복잡한 관계를 '독립'이라는 단순함으로 치환하고, 베이즈 확률의 힘을 빌려 정답의 가능성을 계산하라" — 모든 특징(Feature)이 서로 독립적이라는 강한 가정 하에 베이즈 정리를 적용하여 데이터를 분류하는 확률론적 알고리즘. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Probabilistic Generative Modeling" — 정답(Class)이 주어졌을 때 각 특징이 나타날 확률(Likelihood)을 곱하여 최종적인 사후 확률(Posterior)을 구하고, 가장 높은 확률을 가진 클래스를 정답으로 선택하는 패턴. +- **주요 변종:** + - **Gaussian NB:** 특징이 연속적이고 정규 분포를 따를 때 사용. + - **Multinomial NB:** 특징이 단어 빈도와 같은 이산적인 카운트 데이터일 때 사용. + - **Bernoulli NB:** 특징이 이진(0 또는 1) 값으로 표현될 때 사용. +- **의의:** 학습 속도가 매우 빠르고 적은 데이터로도 준수한 성능을 내어, 딥러닝 이전의 텍스트 분류와 실시간 필터링 시스템의 중추 역할을 수행함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 독립성 가정이 현실과 맞지 않아 성능이 낮을 것이라는 우려와 달리, 실제로는 특징 간의 상관관계가 존재하더라도 최종 분류 결정에는 큰 영향을 주지 않는 경우가 많아(나이브 베이즈의 역설) 여전히 강력한 베이스라인으로 생존함. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 입력 쿼리를 '정보 검색', '코드 생성', '시스템 제어' 등 대분류로 빠르게 라우팅할 때, 최저 비용으로 최대 효율을 내는 가우시안 및 다항 나이브 베이즈 분류기를 병행 운용함. + +## 🔗 지식 연결 (Graph) +- [[Multinomial-Naive-Bayes]], [[Probability-Theory]], [[Supervised-Learning-Foundations]], [[NLP-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Naive-Bayes-Classifiers.md]] diff --git a/10_Wiki/Topics/AI/Named-Entity-Recognition-NER.md b/10_Wiki/Topics/AI/Named-Entity-Recognition-NER.md new file mode 100644 index 00000000..15ea8723 --- /dev/null +++ b/10_Wiki/Topics/AI/Named-Entity-Recognition-NER.md @@ -0,0 +1,28 @@ +--- +id: NLP-NER-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [nlp, ner, named-entity-recognition, information-extraction, bert, knowledge-graph] +last_reinforced: 2026-04-26 +--- + +# [[Named Entity Recognition (NER, 개체명 인식)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "단순한 글자의 나열에서 고유한 의미를 가진 '실체(Entities)'를 발굴하여 지식의 지도를 그려라" — 문장에서 인물, 장소, 조직, 시간 등 미리 정의된 범주의 고유 명사를 식별하고 분류하는 자연어 처리의 핵심 정보 추출 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Sequence Labeling and Semantic Chunking" — 문장의 각 단어(Token)에 대해 개체명의 시작(B-), 중간(I-), 외부(O)를 나타내는 태그(BIO Tagging)를 부여하여 의미 있는 덩어리를 찾아내는 패턴. +- **주요 기법:** + - **Rule-based:** 정규 표현식이나 사전을 이용한 매칭. 전문 도메인(의료, 법률)에서 여전히 유효. + - **Deep Learning (Bi-LSTM+CRF):** 단어의 앞뒤 문맥을 파악하고 라벨 간의 전이 확률을 최적화. + - **Transformer-based (BERT 등):** 거대 언어 모델의 풍부한 문맥 이해력을 활용하여 중의성이 높은 개체명도 정밀하게 인식. +- **의의:** 비정형 텍스트를 구조화된 데이터로 변환하는 첫 단추이며, 질의응답(QA), 기계 번역, 특히 지식 그래프(Knowledge Graph) 구축의 필수 기반 기술임. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 명사를 찾는 수준을 넘어, 이제는 동일한 단어가 문맥에 따라 다른 성격의 개체가 되는 '개체명 중의성 해소(Entity Disambiguation)'와 새로운 개체를 스스로 발견하는 제로샷 NER로 진화 중임. +- **정책 변화:** Antigravity 프로젝트의 지식 가드닝 엔진은 보강된 문서에서 핵심 인물, 기술 스택, 프로젝트명을 NER로 추출하여 지식들 사이의 관계망(Edge)을 자동으로 형성함. + +## 🔗 지식 연결 (Graph) +- [[NLP-Foundations]], [[Knowledge-Graph-Foundations]], [[Linguistic-Analysis-in-AI]], [[BERT-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Named-Entity-Recognition-NER.md]] diff --git a/10_Wiki/Topics/AI/National-Language-Processing.md b/10_Wiki/Topics/AI/National-Language-Processing.md new file mode 100644 index 00000000..a59a4e79 --- /dev/null +++ b/10_Wiki/Topics/AI/National-Language-Processing.md @@ -0,0 +1,28 @@ +--- +id: NLP-NAT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [nlp, national-language, localized-nlp, korean-nlp, language-resources, linguistic-diversity] +last_reinforced: 2026-04-26 +--- + +# [[National Language Processing (국가별 언어 처리 및 자원)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "영어의 문법 체계에 갇히지 말고, 각 언어가 가진 고유한 정서와 문법적 질서(Modality)를 존중하는 지능을 구축하라" — 특정 국가나 지역 언어의 언어학적 특성(교착어, 성조, 어순 등)을 반영한 알고리즘과 국가적 차원에서 구축된 대규모 언어 자산(Corpus)의 결합. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Linguistic Adaptation and Resource Leveraging" — 영어 중심의 토큰화(Tokenization) 방식이 가진 한계를 인식하고, 한국어의 형태소 분석(Morpheme Analysis)이나 복합어 처리와 같이 각 언어의 본질에 최적화된 도구와 국가 표준 말뭉치를 활용하는 현지화 패턴. +- **핵심 요소:** + - **Language-specific Tokenizers:** 한국어의 경우 MeCab, KoNLPy 등 형태소 기반 분리 기술 필수. + - **National Corpora:** 한국의 AI Hub(세종 말뭉치 등), 일본의 BCCWJ와 같이 국가적 차원에서 정제된 고품질 데이터셋 활용. + - **Culturally-aware Models:** 단순 번역을 넘어 해당 언어권의 사회적 맥락, 금기어, 신조어 등을 반영한 미세 조정. +- **의의:** AI가 전 세계의 다양한 문화를 편향 없이 이해하게 하며, 국가 경쟁력 차원에서의 '소버린 AI(Sovereign AI)' 구축의 핵심 기반이 됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 언어별로 개별 모델을 만들어야 했던 시절을 지나, 이제는 수백 개 언어를 동시에 이해하는 다국어 모델(Multilingual Models)이 대세가 되었으나, 여전히 최고 수준의 성능을 위해서는 국가별 특화 데이터로의 정교한 어댑터 학습이 필수적임. +- **정책 변화:** Antigravity 프로젝트는 한국어 사용자의 미묘한 뉘앙스와 전문 용어를 정확히 포착하기 위해, 국립국어원 표준 자원과 최신 한국어 특화 LLM을 결합한 지능형 소통 레이어를 운용함. + +## 🔗 지식 연결 (Graph) +- [[NLP-Foundations]], [[Linguistic-Analysis-in-AI]], [[Transfer-Learning-Foundations]], [[Low-Rank-Adaptation-LoRA]] +- **Raw Source:** [[10_Wiki/Topics/AI/National-Language-Processing.md]] diff --git a/10_Wiki/Topics/AI/Natural-Language-Generation-NLG.md b/10_Wiki/Topics/AI/Natural-Language-Generation-NLG.md new file mode 100644 index 00000000..1b3a4fc2 --- /dev/null +++ b/10_Wiki/Topics/AI/Natural-Language-Generation-NLG.md @@ -0,0 +1,28 @@ +--- +id: NLP-NLG-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [nlp, nlg, natural-language-generation, llm, decoding-strategies, generative-ai] +last_reinforced: 2026-04-26 +--- + +# [[Natural Language Generation (NLG, 자연어 생성)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 정적 정보를 유려한 언어의 흐름으로 치환하여, 기계와 인간이 소통하는 '표현의 창'을 열어라" — 구조화된 데이터나 내부 지식을 인간이 읽고 이해할 수 있는 자연스러운 텍스트 문장으로 변환하는 자연어 처리의 핵심 세부 분야. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Probabilistic Token Sequence Prediction" — 이전까지 생성된 단어들의 맥락을 바탕으로, 다음에 올 가장 적절한 단어를 확률적으로 예측하고 연결하여 하나의 완결된 문장을 완성해 나가는 패턴. +- **핵심 프로세스:** + - **Content Planning:** 무엇을 말할지 결정 (정보 추출 및 요약). + - **Sentence Realization:** 문법적 규칙이나 확률 모델을 사용하여 문장 형성. + - **Decoding Strategies:** Greedy Search, Beam Search, Top-k/Top-p Sampling 등을 통해 생성의 창의성과 정확도 조절. +- **의의:** 챗봇, 자동 기사 작성, 코드 생성, 텍스트 요약 등 현대 생성형 AI(Generative AI)의 사용자 경험을 결정짓는 최종 출력 단계 기술. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 규칙 기반의 템플릿 방식에서 벗어나, 이제는 거대 언어 모델(LLM)이 문맥을 완전히 이해하고 인간과 구분이 불가능할 정도의 고품질 문장을 생성하는 딥러닝 기반 NLG가 지배적인 패러다임이 됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 응답 생성 시, 할루시네이션(Hallucination)을 억제하기 위해 지식 기반(RAG)을 참조한 '근거 중심 생성' 가이드라인을 최우선으로 적용함. + +## 🔗 지식 연결 (Graph) +- [[Natural-Language-Processing-NLP]], [[Transformer-Architecture-Foundations]], [[Decoding-Strategies-in-LLM]], [[Hallucination-in-LLM]] +- **Raw Source:** [[10_Wiki/Topics/AI/Natural-Language-Generation-NLG.md]] diff --git a/10_Wiki/Topics/AI/Natural-Language-Processing-NLP.md b/10_Wiki/Topics/AI/Natural-Language-Processing-NLP.md new file mode 100644 index 00000000..f5ba56b7 --- /dev/null +++ b/10_Wiki/Topics/AI/Natural-Language-Processing-NLP.md @@ -0,0 +1,28 @@ +--- +id: NLP-FOUND-002 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, nlp, natural-language-processing, language-model, foundations] +last_reinforced: 2026-04-26 +--- + +# [[Natural Language Processing (NLP, 자연어 처리)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "인류의 복잡한 언어 체계를 기계의 숫자로 번역하고, 다시 그 숫자를 지혜로운 문장으로 복원하여 인간과 기계의 소통 장벽을 허물어라" — 인간의 언어를 컴퓨터가 처리하고 이해할 수 있도록 분석, 가공, 생성하는 인공지능의 핵심 분야. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Textual Representation and Contextual Understanding" — 파편화된 텍스트 데이터를 토큰화(Tokenization)하고 벡터 공간으로 투영(Embedding)한 뒤, 순환(RNN)이나 주의 집중(Attention) 메커니즘을 통해 문맥적 의미를 파악하는 지능형 해석 패턴. +- **주요 과업:** + - **NLU (Natural Language Understanding):** 구문 분석, 개체명 인식, 감성 분석 등 의미 파악. + - **NLG (Natural Language Generation):** 번역, 요약, 자유 대화 등 문장 생성. + - **Core Processes:** Tokenization -> Stemming/Lemmatization -> POS Tagging -> Dependency Parsing. +- **의의:** 지식의 저장 형태인 '언어'를 다룸으로써, AI가 단순한 도구를 넘어 인간의 지식 체계와 직접 상호작용하는 인터페이스로 진화하게 함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 규칙 기반(Grammar-based) 통계적 분석에서 신경망 기반의 거대 모델로 완전히 패러다임이 시프트되었으며, 이제는 단순 처리를 넘어 '추론(Reasoning)'과 '계획(Planning)'의 영역으로 확장 중임. +- **정책 변화:** Antigravity 프로젝트는 모든 지식 보강 프로세스의 근간으로 고도화된 NLP 파이프라인을 사용하며, 특히 다국어 지원과 전문 용어 보존에 최적화된 하이브리드 토큰화 전략을 채택함. + +## 🔗 지식 연결 (Graph) +- [[Linguistic-Analysis-in-AI]], [[Natural-Language-Generation-NLG]], [[Named-Entity-Recognition-NER]], [[Transformer-Architecture-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Natural-Language-Processing-NLP.md]] diff --git a/10_Wiki/Topics/AI/Nearest-Neighbor-Search.md b/10_Wiki/Topics/AI/Nearest-Neighbor-Search.md new file mode 100644 index 00000000..30cdd7b1 --- /dev/null +++ b/10_Wiki/Topics/AI/Nearest-Neighbor-Search.md @@ -0,0 +1,28 @@ +--- +id: ALGO-NNS-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [algorithm, ai, search, nearest-neighbor, ann, vector-database, similarity-search] +last_reinforced: 2026-04-26 +--- + +# [[Nearest Neighbor Search (최근접 이웃 탐색)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "고차원 공간의 바다에서 나를 가장 닮은 이웃을 눈깜짝할 새에 발굴하여, 데이터 사이의 보이지 않는 연결고리를 증명하라" — 주어진 질의(Query)와 가장 유사한 데이터를 방대한 데이터셋 내에서 거리 메트릭(Euclidean, Cosine 등)을 기반으로 찾아내는 검색 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Space Partitioning and Approximate Retrieval" — 전수 조사(Brute-force)의 비효율성을 극복하기 위해 공간을 다각형이나 트리 구조로 분할하고, 100%의 정확도 대신 압도적인 속도를 선택하는 근사 최근접 이웃(ANN) 검색 패턴. +- **주요 알고리즘:** + - **KD-Tree / Ball-Tree:** 공간을 분할하여 탐색 범위를 좁히는 트리 기반 방식. + - **HNSW (Hierarchical Navigable Small World):** 그래프 구조를 활용한 고성능 검색의 현대적 표준. + - **Product Quantization (PQ):** 벡터를 압축하여 메모리 효율과 검색 속도 동시 확보. +- **의의:** 추천 시스템, 이미지 검색, 특히 LLM의 외부 기억 장치 역할을 하는 벡터 데이터베이스(Vector DB)의 성능을 결정짓는 핵심 엔진. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 '가장 가까운 것'을 찾는 정적 검색에서, 이제는 실시간으로 데이터가 추가/삭제되는 환경에서도 인덱스 성능을 유지하는 동적 인덱싱 기술로 관심사가 이동함. +- **정책 변화:** Antigravity 프로젝트는 1,174개의 문서 중 유사 주제를 추천하거나 중복을 검사할 때, HNSW 알고리즘 기반의 고속 최근접 이웃 탐색 기술을 활용하여 실시간 지식 연결을 구현함. + +## 🔗 지식 연결 (Graph) +- [[Locality-Sensitive-Hashing]], [[Vector-Database-Foundations]], [[K-Nearest-Neighbors-K-NN]], [[Distance-Metrics-in-AI]] +- **Raw Source:** [[10_Wiki/Topics/AI/Nearest-Neighbor-Search.md]] diff --git a/10_Wiki/Topics/AI/Network-Latency-Optimization.md b/10_Wiki/Topics/AI/Network-Latency-Optimization.md new file mode 100644 index 00000000..bb5de604 --- /dev/null +++ b/10_Wiki/Topics/AI/Network-Latency-Optimization.md @@ -0,0 +1,29 @@ +--- +id: SYS-NET-OPT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [infrastructure, network, optimization, latency, cdn, edge-computing, http3] +last_reinforced: 2026-04-26 +--- + +# [[Network Latency Optimization (네트워크 지연 시간 최적화)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터가 이동하는 물리적 거리를 좁히고 통신 프로토콜의 낭비를 제거하여, 지능과 사용자 사이의 '시간적 장벽'을 허물어라" — 네트워크 상에서 데이터 패킷이 출발지에서 목적지까지 도달하는 시간(RTT)을 최소화하기 위한 기술적 및 아키텍처적 최적화 활동. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Proximity and Protocol Efficiency" — 사용자와 가까운 곳에 자원을 배치(Edge)하고, 통신 시작 시 발생하는 핸드셰이크 오버헤드를 줄여(HTTP/3 QUIC) 첫 응답 시간(TTFB)을 단축하는 최적화 패턴. +- **핵심 전략:** + - **CDN (Content Delivery Network):** 전 세계 거점 서버에 데이터를 캐싱하여 물리적 거리 단축. + - **Edge Computing:** 연산 자체를 클라우드 중앙이 아닌 사용자 근처 엣지 노드에서 수행. + - **Protocol Upgrade:** HTTP/2의 멀티플렉싱, HTTP/3의 UDP 기반 빠른 연결 설정 활용. + - **Payload Reduction:** 데이터 압축(Brotli, Gzip) 및 불필요한 헤더 제거. +- **의의:** 0.1초의 지연이 비즈니스 전환율에 직결되는 현대 웹/앱 환경, 특히 실시간 대화가 필수인 AI 에이전트 서비스에서 가장 중요한 인프라 품질 지표. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 대역폭(Bandwidth) 증설이 속도의 전부라는 오해에서 벗어나, 현대는 대역폭보다 지연 시간(Latency) 감소가 사용자 체감 성능에 훨씬 더 큰 영향을 준다는 인식이 정착됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트 브레인과 클라이언트 간의 통신 시, 지연 시간을 최소화하기 위해 WebSocket 스트리밍과 전용 엣지 라우팅 네트워크를 활용함. + +## 🔗 지식 연결 (Graph) +- [[High-Availability-Systems]], [[Load-Balancing-Strategies]], [[Edge-AI-and-Computing]], [[Single-Page-Applications-SPA]] +- **Raw Source:** [[10_Wiki/Topics/AI/Network-Latency-Optimization.md]] diff --git a/10_Wiki/Topics/AI/Neural-Architecture-Search-NAS.md b/10_Wiki/Topics/AI/Neural-Architecture-Search-NAS.md new file mode 100644 index 00000000..5a6f8e08 --- /dev/null +++ b/10_Wiki/Topics/AI/Neural-Architecture-Search-NAS.md @@ -0,0 +1,28 @@ +--- +id: AI-NAS-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, nas, automl, neural-architecture-search, optimization] +last_reinforced: 2026-04-26 +--- + +# [[Neural Architecture Search (NAS, 신경망 구조 탐색)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "인간의 직관에 의존하던 모델 설계를 알고리즘적 탐색으로 전환하여, 데이터에 가장 완벽하게 부합하는 '지능의 형상'을 스스로 창조하라" — 수많은 가능한 신경망 구조 중 성능과 효율성이 가장 뛰어난 아키텍처를 자동으로 찾아내는 AutoML의 핵심 분야. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Automated Structural Optimization" — 탐색 공간(Search Space)을 정의하고, 강화학습이나 유전 알고리즘과 같은 탐색 전략을 통해 후보 아키텍처를 생성한 뒤, 그 성능을 예측하여 최적의 구조를 반복적으로 찾아가는 패턴. +- **3대 핵심 요소:** + - **Search Space:** 어떤 층을 쌓을지, 어떻게 연결할지에 대한 후보 범위 정의. + - **Search Strategy:** 무작위 탐색, 강화학습, 베이지안 최적화 등 최적 구조를 찾아가는 전략. + - **Performance Estimation:** 생성된 구조를 실제로 다 학습시키지 않고도 성능을 빠르게 예측하는 기술. +- **의의:** 인간이 설계한 모델(Inception, ResNet 등)을 뛰어넘는 고성능 모델(EfficientNet, MnasNet 등)을 탄생시켰으며, 특정 하드웨어에 최적화된 맞춤형 AI 모델 구축을 가능케 함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 엄청난 컴퓨팅 자원이 소모된다는 초기 비판을 넘어, 이제는 미분 가능한 탐색 공간(DARTS)이나 한 번의 학습으로 여러 구조를 평가하는 One-shot NAS 등을 통해 연산 비용을 획기적으로 낮춘 실용적 단계에 도달함. +- **정책 변화:** Antigravity 프로젝트는 특정 엣지 기기용 소형 브레인을 설계할 때, 해당 하드웨어의 지연 시간과 메모리 제약을 준수하면서 정확도를 극대화하는 NAS 기반의 모델 커스터마이징을 수행함. + +## 🔗 지식 연결 (Graph) +- [[Hyperparameter-Optimization]], [[Deep-Learning-Foundations]], [[Reinforcement-Learning]], [[Mobile-AI-Optimization]] +- **Raw Source:** [[10_Wiki/Topics/AI/Neural-Architecture-Search-NAS.md]] diff --git a/10_Wiki/Topics/AI/Neural-Networks-for-Beginners.md b/10_Wiki/Topics/AI/Neural-Networks-for-Beginners.md new file mode 100644 index 00000000..3a4eefa6 --- /dev/null +++ b/10_Wiki/Topics/AI/Neural-Networks-for-Beginners.md @@ -0,0 +1,29 @@ +--- +id: AI-NN-BEG-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, neural-networks, beginners-guide, deep-learning, foundations] +last_reinforced: 2026-04-26 +--- + +# [[Neural Networks for Beginners (입문자를 위한 신경망)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "복잡한 뇌의 구조를 흉내 낸 '디지털 뉴런'들이 서로 신호를 주고받으며, 스스로 데이터의 정답을 찾아가는 과정을 이해하라" — 비전공자나 입문자도 신경망의 기본 원리인 '입력, 가중치 계산, 활성화, 학습'의 흐름을 직관적으로 파악할 수 있게 돕는 개념 가이드. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Simple Signal Processing and Feedback" — 입력값에 중요도(Weight)를 곱하고 더한 뒤, 특정 기준(Activation)을 넘으면 다음으로 신호를 전달하며, 틀렸을 경우 그 차이만큼 가중치를 조금씩 수정하는 반복적인 피드백 패턴. +- **핵심 구성 요소:** + - **Neuron (뉴런):** 신호를 받아 처리하는 가장 작은 단위. + - **Weight (가중치):** 데이터의 중요도. + - **Activation Function (활성화 함수):** 신호를 보낼지 말지 결정하는 스위치. + - **Layer (층):** 뉴런들이 모여 형성하는 단계 (입력층, 은닉층, 출력층). +- **의의:** AI의 블랙박스 같은 이미지를 걷어내고, 결국 '수많은 작은 계산기들의 협력'이라는 본질을 이해함으로써 더 깊은 학습으로 나아가는 징검다리 역할. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 신경망을 단순히 '생물학적 뇌의 복제품'으로 설명하던 과거 방식에서 벗어나, 이제는 '미분 가능한 거대한 수학 함수'로서의 공학적 측면을 명확히 전달하는 것이 현대 교육의 트렌드임. +- **정책 변화:** Antigravity 프로젝트는 신규 사용자가 시스템의 원리를 물을 때, 이 입문자용 신경망 개념을 바탕으로 비유와 직관을 곁들여 설명하는 '친절한 AI' 모드를 운용함. + +## 🔗 지식 연결 (Graph) +- [[Deep-Learning-Foundations]], [[Multilayer-Perceptron-MLP]], [[Activation-Functions]], [[Backpropagation-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Neural-Networks-for-Beginners.md]] diff --git a/10_Wiki/Topics/AI/Neural-Style-Transfer.md b/10_Wiki/Topics/AI/Neural-Style-Transfer.md new file mode 100644 index 00000000..6a419a38 --- /dev/null +++ b/10_Wiki/Topics/AI/Neural-Style-Transfer.md @@ -0,0 +1,28 @@ +--- +id: AI-NST-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, computer-vision, neural-style-transfer, nst, generative-art, vgg] +last_reinforced: 2026-04-26 +--- + +# [[Neural Style Transfer (신경망 스타일 전이)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "원본의 '형체'는 유지하되 화가의 '붓 터치'를 덧입혀, 기계의 계산으로 예술의 영혼을 재현하라" — 콘텐츠 이미지의 구조적 정보와 스타일 이미지의 예술적 질감을 신경망 내부에서 분리하고 합성하여 새로운 이미지를 생성하는 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Feature Disentanglement and Recomposition" — 미리 학습된 합성곱 신경망(주로 VGG-19)의 깊은 층에서는 사물의 형태를, 얕은 층에서는 색감과 질감을 추출한다는 점을 활용하여 두 특징 사이의 손실(Loss)을 최소화하며 픽셀을 최적화하는 패턴. +- **핵심 손실 함수:** + - **Content Loss:** 원본 이미지와 생성된 이미지의 특징 맵 차이 측정. + - **Style Loss:** 스타일 이미지의 특징들 사이의 상관관계(Gram Matrix)를 통해 예술적 패턴 복제. + - **Total Variation Loss:** 이미지의 노이즈를 줄이고 매끄럽게 만듦. +- **의의:** 딥러닝이 단순한 분류를 넘어 창의적인 예술 영역(Generative Art)에 발을 들이게 한 결정적인 사례이며, 필터 앱이나 영상 효과 등 실전 서비스에 널리 응용됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 초기에는 한 장의 이미지를 생성하는 데 수천 번의 반복 연산이 필요했으나, 이제는 Fast Style Transfer나 AdaIN(Adaptive Instance Normalization) 기법을 통해 실시간으로 스타일을 입히는 것이 가능해짐. +- **정책 변화:** Antigravity 프로젝트는 에이전트가 생성하는 시각적 리포트나 대시보드 테마에 사용자의 취향을 반영한 스타일 전이 기술을 적용하여 개인화된 UI 경험을 제공함. + +## 🔗 지식 연결 (Graph) +- [[Computer-Vision-Foundations]], [[Generative-Adversarial-Networks-GAN]], [[Image-Segmentation]], [[Convolutional-Neural-Networks-CNN]] +- **Raw Source:** [[10_Wiki/Topics/AI/Neural-Style-Transfer.md]] diff --git a/10_Wiki/Topics/AI/Neuro-Symbolic-AI.md b/10_Wiki/Topics/AI/Neuro-Symbolic-AI.md index 9238a6a5..67f58e75 100644 --- a/10_Wiki/Topics/AI/Neuro-Symbolic-AI.md +++ b/10_Wiki/Topics/AI/Neuro-Symbolic-AI.md @@ -1,33 +1,28 @@ --- -id: P-REINFORCE-AUTO-NSAI-001 +id: AI-HYBRID-001 category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.95 -tags: [auto-reinforced, logic, reasoning] -last_reinforced: 2026-04-20 +confidence_score: 1.0 +tags: [ai, neuro-symbolic, deep-learning, symbolic-logic, reasoning, hybrid-ai] +last_reinforced: 2026-04-26 --- -# [[Neuro-Symbolic AI]] +# [[Neuro-Symbolic AI (뉴로-심볼릭 AI)]] ## 📌 한 줄 통찰 (The Karpathy Summary) -> "시스템 1(빠른 직관, 신경망)과 시스템 2(느린 추론, 기호 논리)의 인지적 융합을 통해, 인공지능의 신뢰성과 범용성을 확보하려는 3세대 AI 패러다임." +> "딥러닝의 압도적인 '직관'과 심볼릭 논리의 명확한 '이성'을 결합하여, 생각하고 설명하는 완전한 지능을 구현하라" — 신경망 기반의 패턴 인식 능력과 기호 기반의 추론 능력을 통합하여, 데이터 효율성, 해석 가능성, 그리고 복잡한 논리 전개 능력을 동시에 확보하는 AI 패러다임. ## 📖 구조화된 지식 (Synthesized Content) -Neuro-Symbolic AI(신경-기호 인공지능)는 현대 딥러닝의 패턴 매칭 능력과 고전적 AI의 추론 능력을 결합한 형태입니다. - -1. **핵심 아키텍처**: - * **Neural Front-end**: 센서 데이터(이미지, 텍스트)를 이해하고 객체를 감지. - * **Symbolic Reasoner**: 감지된 객체들 사이의 관계를 논리적으로 정의하고, 규칙(Rules)에 따라 결과 도출. -2. **주요 이점**: - * **신뢰성 하이킹**: 논리적 일관성을 강제함으로써 LLM 등에서 발생하는 환각(Hallucination) 현상을 획기적으로 줄일 수 있음. - * **설명 가능성(XAI)**: 기호화된 추론 과정을 통해 AI의 의사결정 이유를 인간이 이해하기 쉬운 형태로 제공. -3. **주요 사례**: - * **IBM NS-VQA**: 이미지를 보고 "빨간 공 위에 있는 녹색 큐브는 몇 개인가?"와 같은 복합 질문에 대해 논리적 스텝별로 답변. +- **추출된 패턴:** "Pattern Perception and Logical Deduction" — 딥러닝이 비정형 데이터(이미지, 음성 등)에서 의미 있는 심볼(개체, 속성)을 추출하면, 심볼릭 엔진이 미리 정의된 지식 그래프나 논리 규칙을 바탕으로 정답을 유추하고 그 과정을 설명하는 하이브리드 패턴. +- **주요 특징:** + - **Data Efficiency:** 수만 장의 사진 대신, 몇 개의 논리 규칙과 소량의 데이터만으로도 학습 가능. + - **Explainability:** 결과 도출 과정이 논리적으로 기록되어 "왜 그렇게 판단했는지" 인간이 이해할 수 있음. + - **Out-of-distribution Generalization:** 학습하지 않은 새로운 환경에서도 보편적인 논리 법칙을 적용하여 대응 가능. +- **의의:** 현재 LLM의 한계인 할루시네이션(Hallucination)과 논리적 오류를 극복하기 위한 강력한 대안으로 주목받고 있음. ## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌**: 과거 기호주의 AI는 모든 규칙을 수동으로 입력해야 하는 '지식 공학의 병목' 문제가 있었으나, 현대 모델은 신경망이 스스로 기호와 규칙을 학습(Self-supervised Learning)하도록 진화함. -- **정책 변화(RL Update)**: 강화 학습 분야에서 에이전트가 복잡한 미션을 수행할 때, 보상 함수를 기호 논리(LTL, Linear Temporal Logic)로 정의하여 안전하고 목적 지향적인 행동을 유도하는 방식이 주목받고 있음. +- **과거 데이터와의 충돌:** 신경망과 심볼릭 모델은 서로 섞일 수 없는 기름과 물과 같다는 인식을 넘어, 최근에는 신경망 내부에서 논리를 학습하거나(Logic Neural Networks) 심볼을 벡터로 변환하여 처리하는 등 유기적인 통합이 가속화됨. +- **정책 변화:** Antigravity 에이전트는 사용자의 질문을 이해할 때는 딥러닝(Neural)을 쓰고, 작업 계획을 세우거나 지식 그래프를 업데이트할 때는 엄격한 논리 규칙(Symbolic)을 적용하는 뉴로-심볼릭 아키텍처를 지향함. ## 🔗 지식 연결 (Graph) -- **Related**: [[Neural-Symbolic Integration]], [[Common Sense Reasoning]], [[Explainable AI (XAI)]], [[Cognitive Architectures]] -- **Modern Tech/Tools**: IBM Neuro-Symbolic AI Toolkit, Scallop Language, Logic Tensor Networks. ---- +- [[Model-Interpretability-Tools]], [[Knowledge-Graph-Foundations]], [[Reasoning-and-Planning-in-AI]], [[Trustworthy-AI]] +- **Raw Source:** [[10_Wiki/Topics/AI/Neuro-Symbolic-AI.md]] diff --git a/10_Wiki/Topics/AI/Neuroevolution.md b/10_Wiki/Topics/AI/Neuroevolution.md new file mode 100644 index 00000000..c694fe59 --- /dev/null +++ b/10_Wiki/Topics/AI/Neuroevolution.md @@ -0,0 +1,27 @@ +--- +id: AI-NEV-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, neural-networks, neuroevolution, genetic-algorithms, evolutionary-computation, neat] +last_reinforced: 2026-04-26 +--- + +# [[Neuroevolution (신경 진화)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "미분 불가능한 세상의 장벽을 자연의 섭리인 '적자생존'으로 돌파하여, 스스로 진화하는 신경망의 생태계를 구축하라" — 유전 알고리즘과 같은 진화 연산을 사용하여 신경망의 가중치뿐만 아니라 아키텍처(Topology) 자체를 최적화하는 학습 기법. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Survival of the Fittest and Topology Growth" — 정답을 직접 가르쳐주는 대신, 여러 신경망 후보군(Population)을 환경에 던져놓고 성능이 좋은 개체들을 선택하여 교배(Crossover)와 돌연변이(Mutation)를 통해 다음 세대를 창조하는 진화적 패턴. +- **핵심 알고리즘:** + - **NEAT (NeuroEvolution of Augmenting Topologies):** 최소한의 구조에서 시작하여 필요에 따라 뉴런과 연결을 점진적으로 추가하며 진화. + - **Evolution Strategies (ES):** 가중치 업데이트 방향을 무작위 섭동(Perturbation)을 통해 탐색. +- **의의:** 오차 역전파를 위한 미분이 불가능하거나 보상이 매우 드문(Sparse Reward) 환경에서도 작동하며, 신경망 구조 설계의 자동화(AutoML)에 기여함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 경사 하강법보다 느리고 비효율적이라는 인식이 강했으나, 병렬 연산 자원의 폭증과 결합하여 아주 복잡한 강화학습 환경에서는 오히려 딥러닝보다 더 빠르고 유연한 해법을 제시하는 사례(OpenAI의 ES 연구 등)가 보고됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 전략적 행동 양식을 최적화할 때, 기존의 강화학습 모델과 신경 진화 알고리즘을 앙상블하여 예기치 못한 상황에 대한 적응력을 높임. + +## 🔗 지식 연결 (Graph) +- [[Genetic-Algorithms]], [[Reinforcement-Learning]], [[Neural-Architecture-Search-NAS]], [[Deep-Learning-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Neuroevolution.md]] diff --git a/10_Wiki/Topics/AI/Next-js-and-Modern-Web.md b/10_Wiki/Topics/AI/Next-js-and-Modern-Web.md new file mode 100644 index 00000000..1138269d --- /dev/null +++ b/10_Wiki/Topics/AI/Next-js-and-Modern-Web.md @@ -0,0 +1,29 @@ +--- +id: WEB-NEXT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [web-development, next-js, react, frontend-architecture, ssr, modern-web] +last_reinforced: 2026-04-26 +--- + +# [[Next.js and Modern Web (Next.js와 현대 웹)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "클라이언트와 서버의 경계를 허물고 최적의 렌더링 전략을 자동화하여, 사용자에게는 극강의 속도를, 개발자에게는 최고의 생산성을 제공하라" — React 기반의 풀스택 프레임워크로, SSR, SSG, ISR 및 서버 컴포넌트를 통해 현대 웹사이트 아키텍처의 표준을 제시하는 기술 스택. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Hybrid Rendering and Zero-config Optimization" — 페이지의 특성에 따라 빌드 타임에 미리 생성(SSG)할지, 요청 시점에 생성(SSR)할지, 혹은 배경에서 갱신(ISR)할지를 유연하게 선택하고 이미지 최적화 및 폰트 로딩을 자동으로 처리하는 최적화 패턴. +- **주요 기능:** + - **App Router:** 파일 시스템 기반 라우팅과 레이아웃 중첩 지원. + - **Server Components:** 클라이언트로 전송되는 자바스크립트 양을 획기적으로 줄여 로딩 속도 개선. + - **Data Fetching:** 서버 단위에서의 캐싱과 재검증(Revalidation)을 통한 데이터 무결성 유지. + - **Edge Runtime:** 전 세계 엣지 노드에서 코드를 실행하여 지연 시간 최소화. +- **의의:** SEO 성능과 사용자 인터랙션을 모두 잡아야 하는 현대 비즈니스 웹사이트의 필수 아키텍처이며, Vercel 생태계를 통한 배포 자동화의 정수. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 'React의 헬퍼' 수준이던 Pages Router 방식에서, 이제는 서버 중심의 사고를 강조하는 App Router와 서버 컴포넌트 중심으로 패러다임이 완전히 전환됨. +- **정책 변화:** Antigravity 프로젝트의 모든 웹 대시보드와 지식 인터페이스는 Next.js 14+ 아키텍처를 기반으로 설계되어, 초저지연 로딩과 강력한 SEO 성능을 동시에 보장함. + +## 🔗 지식 연결 (Graph) +- [[Modern-Website-Architecture]], [[Core-Web-Vitals]], [[Single-Page-Applications-SPA]], [[Network-Latency-Optimization]] +- **Raw Source:** [[10_Wiki/Topics/AI/Next-js-and-Modern-Web.md]] diff --git a/10_Wiki/Topics/AI/NoSQL-Databases-in-AI.md b/10_Wiki/Topics/AI/NoSQL-Databases-in-AI.md new file mode 100644 index 00000000..99b3b782 --- /dev/null +++ b/10_Wiki/Topics/AI/NoSQL-Databases-in-AI.md @@ -0,0 +1,29 @@ +--- +id: SYS-NOSQL-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [infrastructure, database, nosql, mongodb, cassandra, big-data, ai] +last_reinforced: 2026-04-26 +--- + +# [[NoSQL Databases in AI (AI에서의 NoSQL 데이터베이스)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "정형화된 표의 형식을 깨고 데이터의 자유로운 흐름을 수용하여, AI가 필요로 하는 방대한 비정형 지식을 가공 없이 저장하라" — 관계형 데이터베이스(RDBMS)의 엄격한 스키마 제약에서 벗어나, 유연한 구조로 대규모 데이터를 고속으로 처리하고 확장하는 데이터 저장 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Schema-less Scalability and Document-oriented Storage" — 데이터의 형태가 고정되지 않은 웹 로그, SNS 텍스트, 센서 데이터 등을 JSON과 유사한 문서 형태로 저장하거나 키-값 쌍으로 관리함으로써, 데이터 모델의 변경에 유연하게 대응하고 수평적 확장(Scaling out)을 용이하게 하는 패턴. +- **주요 유형:** + - **Document-oriented (MongoDB):** JSON 형태의 유연한 데이터 저장. 에이전트의 대화 로그나 설정 관리에 적합. + - **Key-Value (Redis):** 초고속 인메모리 저장소. 실시간 피드백 및 캐싱에 활용. + - **Column-family (Cassandra, HBase):** 대규모 분산 데이터 처리. 로그 분석 및 시계열 데이터에 최적. + - **Graph Database (Neo4j):** 개체 간의 복잡한 연결 관계(Knowledge Graph) 표현. +- **의의:** 정형 데이터보다 비정형 데이터의 비중이 압도적인 현대 AI 학습 환경에서, 데이터 파이프라인의 유연성과 병목 현상 해소를 보장하는 인프라적 토대. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** NoSQL은 데이터 정밀도나 트랜잭션 안전성(ACID)이 떨어진다는 우려가 있었으나, 최근에는 NewSQL의 등장과 각 DB 엔진의 기능 개선으로 고도의 일관성과 확장성을 동시에 확보하는 방향으로 진화함. +- **정책 변화:** Antigravity 프로젝트는 에이전트가 수집하는 원시 지식(Raw Data)의 임시 저장 및 사고 로그 기록 시 MongoDB와 Redis 기반의 NoSQL 아키텍처를 우선적으로 적용함. + +## 🔗 지식 연결 (Graph) +- [[Indexing-Strategies]], [[Knowledge-Graph-Foundations]], [[High-Availability-Systems]], [[System-Design-for-AI-Scale]] +- **Raw Source:** [[10_Wiki/Topics/AI/NoSQL-Databases-in-AI.md]] diff --git a/10_Wiki/Topics/AI/Noise-Reduction-in-AI.md b/10_Wiki/Topics/AI/Noise-Reduction-in-AI.md new file mode 100644 index 00000000..1a8c3b3a --- /dev/null +++ b/10_Wiki/Topics/AI/Noise-Reduction-in-AI.md @@ -0,0 +1,28 @@ +--- +id: AI-NOISE-RED-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, noise-reduction, denoising, signal-processing, autoencoder] +last_reinforced: 2026-04-26 +--- + +# [[Noise Reduction in AI (AI에서의 노이즈 제거)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 본질을 가리는 불필요한 흔적들을 정교하게 닦아내어, 기계가 가장 순수한 정보에 집중하게 하라" — 이미지, 음성, 텍스트 등 다양한 신호 데이터에 포함된 무작위 노이즈를 식별하고 제거하여 모델의 정확도와 사용자 체감 품질을 높이는 전처리 및 학습 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Feature Distillation and Reconstruction" — 원본 데이터를 의도적으로 오염시킨 뒤 이를 원래대로 복원하게 학습시키는 디노이징 오토인코더(Denoising Autoencoder) 기법을 통해, 모델이 데이터의 핵심적인 특징과 구조를 스스로 파악하게 만드는 패턴. +- **주요 적용 분야:** + - **Image Denoising:** 저조도 사진의 노이즈 제거 및 초해상도(Super Resolution) 복원. + - **Speech Enhancement:** 주변 소음 제거 및 목소리 명료도 향상. + - **Text Cleaning:** 오타 교정 및 비정형 텍스트 내 불필요한 특수문자 제거. +- **의의:** 실제 환경에서 수집되는 데이터는 항상 불완전하므로, 노이즈 제거 기술은 AI가 연구실을 넘어 현실 세계에서 안정적으로 작동하게 만드는 방어 기제이자 필수 역량임. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순한 필터링 방식에서 벗어나, 이제는 확산 모델(Diffusion Models)의 노이즈 제거 프로세스를 역이용하여 새로운 정보를 생성하거나 고도의 복원 성능을 달성하는 생성적 노이즈 제거 방식으로 고도화됨. +- **정책 변화:** Antigravity 프로젝트는 외부 원시 데이터 수집 시, 텍스트 내의 중복 기호나 광고성 노이즈를 1차적으로 필터링하는 전용 노이즈 리덕션 파이프라인을 가동하여 지식의 순도를 관리함. + +## 🔗 지식 연결 (Graph) +- [[Generative-Adversarial-Networks-GAN]], [[Autoencoders-in-Deep-Learning]], [[Pre-processing-Data-for-AI]], [[Signal-Processing-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Noise-Reduction-in-AI.md]] diff --git a/10_Wiki/Topics/AI/Non-linear-Activation-Functions.md b/10_Wiki/Topics/AI/Non-linear-Activation-Functions.md new file mode 100644 index 00000000..461a7a28 --- /dev/null +++ b/10_Wiki/Topics/AI/Non-linear-Activation-Functions.md @@ -0,0 +1,29 @@ +--- +id: DL-ACT-NLIN-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, activation-functions, non-linearity, relu, sigmoid] +last_reinforced: 2026-04-26 +--- + +# [[Non-linear Activation Functions (비선형 활성화 함수)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "단조로운 직선의 세계에 '굴곡'을 부여하여, 신경망이 세상의 모든 복잡한 함수를 근사할 수 있는 무한한 표현력을 갖게 하라" — 각 뉴런의 출력을 비선형적으로 변환함으로써 심층 신경망이 선형적인 한계를 극복하고 고차원적인 패턴을 학습하게 만드는 핵심 장치. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Linear Combination and Non-linear Transformation" — 입력을 가중합한 결과를 그대로 내보내지 않고 특정 임계값에서 꺾거나(ReLU), 0과 1 사이로 압축(Sigmoid)하는 변환을 통해 층을 쌓을수록 모델의 지능적 깊이가 깊어지게 하는 패턴. +- **주요 함수:** + - **ReLU (Rectified Linear Unit):** 음수면 0, 양수면 그대로. 연산이 빠르고 기울기 소실(Vanishing Gradient) 문제를 크게 개선. + - **Sigmoid:** 0과 1 사이의 확률값 반환. 초기 신경망의 표준이었으나 현재는 출력층에서 주로 사용. + - **Tanh:** -1과 1 사이로 압축하여 데이터의 중심을 0으로 맞춤. + - **Leaky ReLU/GELU:** ReLU의 단점(Dying ReLU)을 보완한 최신 변종들. +- **의의:** 비선형 활성화 함수가 없다면 아무리 깊은 신경망도 단일 레이어의 선형 회귀와 수학적으로 동일해지며, 딥러닝이라는 학문 자체가 성립하지 않게 됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 시그모이드가 가장 인간의 뇌와 닮아 최선이라는 믿음에서 벗어나, 이제는 학습의 안정성과 속도를 위해 ReLU 계열과 트랜스포머에서 쓰이는 GELU 등이 실질적인 표준으로 자리 잡음. +- **정책 변화:** Antigravity 프로젝트는 대규모 언어 모델 아키텍처 설계 시, 수학적 부드러움과 성능 최적화가 검증된 SwiGLU 또는 GELU 활성화 함수를 기본 사양으로 채택함. + +## 🔗 지식 연결 (Graph) +- [[Activation-Functions]], [[Leaky-ReLU-and-Activations]], [[Deep-Learning-Foundations]], [[Backpropagation-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Non-linear-Activation-Functions.md]] diff --git a/10_Wiki/Topics/AI/Non-parametric-Models.md b/10_Wiki/Topics/AI/Non-parametric-Models.md new file mode 100644 index 00000000..2814d38b --- /dev/null +++ b/10_Wiki/Topics/AI/Non-parametric-Models.md @@ -0,0 +1,28 @@ +--- +id: ML-NPAR-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [machine-learning, statistics, non-parametric, knn, decision-trees, data-driven] +last_reinforced: 2026-04-26 +--- + +# [[Non-parametric Models (비모수 모델)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 형상을 미리 짐작하여 가두지 말고, 데이터 스스로가 자신의 구조를 드러내게 하라" — 고정된 수의 매개변수를 가지지 않고, 데이터의 규모에 따라 모델의 복잡도가 유연하게 변화하는 머신러닝 알고리즘 체계. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Instance-based and Flexible Representation" — 데이터를 선형이나 정규 분포와 같은 특정 수식으로 요약하는 대신, 데이터 포인트 그 자체를 기억하거나(K-NN) 영역을 잘게 쪼개어(Decision Trees) 복잡하고 불규칙한 데이터의 경계면을 있는 그대로 학습하는 패턴. +- **주요 특징:** + - **Flexibility:** 데이터의 분포에 대해 강한 가정을 하지 않으므로 매우 유연함. + - **Model Complexity:** 데이터셋의 크기가 커질수록 필요한 매개변수나 저장 용량도 비례해서 증가함. + - **Overfitting Risk:** 데이터의 노이즈까지 학습할 위험이 있어 적절한 규제가 필수적임. +- **의의:** 데이터의 패턴이 매우 복잡하거나 사전 지식이 부족한 도메인에서, 고정된 선형 모델보다 훨씬 높은 적응력을 발휘함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 비모수 모델은 매개변수가 '없다'는 뜻이 아니라, 그 수가 고정되지 않았음을 의미함. 최근에는 가우시안 프로세스(Gaussian Processes)나 베이지안 비모수 모델 등을 통해 불확실성까지 정밀하게 측정하는 방향으로 고도화됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 소요 시간 예측이나 이상 탐지(Anomaly Detection) 시, 데이터의 분포를 미리 예단하지 않기 위해 비모수적 접근법인 커널 밀도 추정(KDE)이나 랜덤 포레스트를 적극 활용함. + +## 🔗 지식 연결 (Graph) +- [[K-Nearest-Neighbors-K-NN]], [[Decision-Trees-and-Random-Forests]], [[Support-Vector-Machines-SVM]], [[Instance-based-Learning]] +- **Raw Source:** [[10_Wiki/Topics/AI/Non-parametric-Models.md]] diff --git a/10_Wiki/Topics/AI/Normalization-Strategies.md b/10_Wiki/Topics/AI/Normalization-Strategies.md new file mode 100644 index 00000000..8cfd88fd --- /dev/null +++ b/10_Wiki/Topics/AI/Normalization-Strategies.md @@ -0,0 +1,29 @@ +--- +id: DL-NORM-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, normalization, batch-norm, layer-norm, training-stability] +last_reinforced: 2026-04-26 +--- + +# [[Normalization Strategies (정규화 전략)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 날것 그대로의 요동을 차분히 길들여, 신경망이 혼란 없이 최적의 길(Gradient)을 찾도록 하라" — 신경망 내부의 데이터 분포를 일정하게 유지함으로써 학습 속도를 높이고 기울기 소실/폭주 문제를 완화하여 모델의 수렴 안정성을 극대화하는 기법. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Distribution Realignment and Internal Covariate Shift Mitigation" — 각 층을 통과하며 변하는 데이터의 평균과 분산을 특정 범위(보통 평균 0, 분산 1)로 강제로 조정하여, 후속 레이어들이 안정적인 입력 데이터 분포를 바탕으로 학습에만 집중하게 만드는 패턴. +- **주요 전략:** + - **Batch Normalization:** 미니 배치 단위의 통계량을 사용하여 정규화. CNN 등 일반적인 딥러닝에서 매우 효과적. + - **Layer Normalization:** 각 데이터 샘플 내의 모든 특징을 기준으로 정규화. 시퀀스 데이터와 Transformer 아키텍처의 표준. + - **Instance Normalization:** 각 채널별로 정규화. 주로 스타일 전이(Style Transfer) 및 생성 모델에서 사용. + - **Group Normalization:** 특징 채널을 그룹으로 묶어 정규화. 배치 크기가 매우 작을 때 Batch Norm의 대안으로 활용. +- **의의:** 더 깊은 신경망을 더 높은 학습률로 더 빠르게 학습시킬 수 있게 하는 현대 딥러닝 최적화의 핵심 인프라. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 정규화가 단순히 내부 공변량 변화(Internal Covariate Shift)를 줄이기 때문이라는 초기 가설을 넘어, 실제로는 손실 함수 곡면(Loss Landscape)을 매끄럽게 만들어 최적화를 쉽게 한다는 평탄화(Smoothing) 관점이 현대적 정설임. +- **정책 변화:** Antigravity 프로젝트는 대규모 언어 모델 학습 및 추론 시, 연산 효율과 안정성이 입증된 Pre-Layer Normalization 아키텍처를 기본 사양으로 적용함. + +## 🔗 지식 연결 (Graph) +- [[Layer-Normalization]], [[Batch-Normalization-Exploration]], [[Deep-Learning-Foundations]], [[Gradient-Descent-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Normalization-Strategies.md]] diff --git a/10_Wiki/Topics/AI/Object-Detection-Foundations.md b/10_Wiki/Topics/AI/Object-Detection-Foundations.md new file mode 100644 index 00000000..1c34b265 --- /dev/null +++ b/10_Wiki/Topics/AI/Object-Detection-Foundations.md @@ -0,0 +1,30 @@ +--- +id: CV-OBJ-DET-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [computer-vision, ai, object-detection, yolo, bounding-box, localization] +last_reinforced: 2026-04-26 +--- + +# [[Object Detection Foundations (객체 탐지 기초)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "이미지라는 평면 공간에서 사물의 '무엇(What)'과 '어디(Where)'를 동시에 정복하여, 기계가 시각적 세계를 논리적으로 해체하게 하라" — 이미지 내에 존재하는 여러 객체의 종류를 분류(Classification)하고 그 위치를 경계 상자(Bounding Box)로 표시(Localization)하는 컴퓨터 비전 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Feature Pyramid and Anchors" — 다양한 크기의 객체를 잡기 위해 이미지의 여러 해상도에서 특징을 추출하고, 미리 정의된 사각형(Anchors)을 바탕으로 실제 객체의 위치를 미세하게 조정하여 예측하는 패턴. +- **주요 아키텍처:** + - **One-stage Detectors (YOLO, SSD):** 이미지 전체를 한 번만 훑어 즉시 결과 도출. 매우 빠름. + - **Two-stage Detectors (R-CNN, Faster R-CNN):** 후보 영역을 먼저 뽑고 상세 검증. 정밀도가 높음. +- **핵심 지표:** + - **IoU (Intersection over Union):** 정답 상자와 예측 상자가 얼마나 겹치는지 측정. + - **mAP (mean Average Precision):** 모델의 전체적인 탐색 성능을 나타내는 표준 평가지표. +- **의의:** 자율주행차의 장애물 인식, CCTV의 이상 행동 감지, 공정 자동화의 불량 검출 등 시각 지능이 필요한 모든 실전 분야의 핵심 기술. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 앵커 박스(Anchors)를 설계하는 수작업의 복잡함을 넘어, 최근에는 앵커 없이 점이나 중심을 기반으로 탐지하는 Anchor-free 방식(CenterNet 등)과 트랜스포머를 활용한 DETR 계열이 주류로 부상함. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 시각 인터페이스 분석 시, 저지연 응답을 위해 최적화된 YOLOv8 아키텍처를 기반으로 화면 내의 버튼, 텍스트 입력창 등 UI 요소를 실시간으로 탐지함. + +## 🔗 지식 연결 (Graph) +- [[Computer-Vision-Foundations]], [[Image-Segmentation]], [[Convolutional-Neural-Networks-CNN]], [[Non-linear-Activation-Functions]] +- **Raw Source:** [[10_Wiki/Topics/AI/Object-Detection-Foundations.md]] diff --git a/10_Wiki/Topics/AI/Object-Oriented-Programming.md b/10_Wiki/Topics/AI/Object-Oriented-Programming.md index 51779345..60be6cc9 100644 --- a/10_Wiki/Topics/AI/Object-Oriented-Programming.md +++ b/10_Wiki/Topics/AI/Object-Oriented-Programming.md @@ -1,32 +1,29 @@ --- -id: P-REINFORCE-AUTO-OOPP-001 +id: CS-OOP-001 category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.98 -tags: [auto-reinforced, oop, software-engineering, abstraction, encapsulation, inheritance, polymorphism] -last_reinforced: 2026-04-20 +confidence_score: 1.0 +tags: [computer-science, software-engineering, oop, solid, encapsulation, design-patterns] +last_reinforced: 2026-04-26 --- -# [[Object-Oriented-Programming]] +# [[Object-Oriented Programming (OOP, 객체 지향 프로그래밍)]] ## 📌 한 줄 통찰 (The Karpathy Summary) -> "세상을 변수와 함수로 빚다: 현실의 사물을 '객체(Object)'라는 자율적인 단위로 모델링하고, 이들이 서로 메시지를 주고받으며 협업하게 함으로써 거대하고 복잡한 소프트웨어를 인간의 직관으로 통제 가능하게 만드는 설계 패러다임." +> "데이터와 행위를 하나의 '객체'라는 유기체로 묶고, 이들의 소통과 연합으로 거대하고 견고한 소프트웨어 제국을 건설하라" — 프로그램을 단순히 명령어의 나열이 아닌 독립된 단위인 '객체'들의 집합으로 파악하여 유연성과 재사용성을 극대화하는 프로그래밍 패러다임. ## 📖 구조화된 지식 (Synthesized Content) -객체 지향 프로그래밍(OOP)은 데이터와 그 데이터를 처리하는 함수를 하나의 단위(객체)로 묶어 처리하는 방식입니다. - -1. **4대 핵심 원칙 (A PIE)**: - * **Abstraction (추상화)**: 불필요한 디테일을 숨기고 핵심 인터페이스만 노출. (Abstraction와 연결) - * **Polymorphism (다형성)**: 하나의 인터페이스로 다양한 형태의 구현체 실행. - * **Inheritance (상속)**: 부모의 속성을 물려받아 재사용 및 확장. (Efficiency와 연결) - * **Encapsulation (캡슐화)**: 데이터와 기능을 하나로 묶고 외부 접근을 제한 (정보 은닉). (Modularity와 연결) -2. **왜 중요한가?**: - * 코드의 재사용성과 유지보수성을 극대화하여, 수십만 줄의 코드가 얽힌 대형 프로젝트에서도 변경의 파급력을 최소화할 수 있기 때문임. +- **추출된 패턴:** "Modular Autonomy and Interface-based Contract" — 내부의 구현 상세는 감추고(Encapsulation), 공통 기능은 물려받으며(Inheritance), 동일한 메시지에도 각자 다르게 반응(Polymorphism)하게 함으로써 코드 간의 결합도를 낮추고 변화에 강한 구조를 만드는 패턴. +- **4대 핵심 원칙:** + - **Encapsulation (캡슐화):** 데이터와 함수를 하나로 묶고 외부 접근을 제한하여 무결성 보호. + - **Inheritance (상속):** 기존 클래스의 기능을 물려받아 재사용 및 확장. + - **Polymorphism (다형성):** 하나의 인터페이스로 여러 타입의 객체를 다룰 수 있는 능력. + - **Abstraction (추상화):** 복잡한 내부 로직은 숨기고 핵심 인터페이스만 노출. +- **의의:** 대규모 협업 프로젝트에서 코드의 가독성과 유지보수성을 보장하는 현대 소프트웨어 공학의 가장 강력한 지배적 패러다임. ## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌**: 과거에는 복잡한 상속 구조 정책(Deep Inheritance)이 미덕이었으나, 현대 정책은 유연성을 해치는 상속보다는 작고 독립적인 기능을 조합하는 '구성(Composition) 우선 정책'을 선호함(RL Update). -- **정책 변화(RL Update)**: 순수 OOP 정책을 넘어, 상태 변화를 최소화하고 부작용을 없애는 '함수형 프로그래밍(Functional Programming) 정책'과 OOP를 적절히 혼합하여 사용하는 하이브리드 설계 정책이 현대 소프트웨어의 표준 정책임. +- **과거 데이터와의 충돌:** 상속이 만능이라는 믿음에서 벗어나, 과도한 상속 깊이가 코드를 더 복잡하게 만드는 문제를 해결하기 위해 '상속보다는 합성(Composition over Inheritance)'을 지향하는 실무적 지침이 정립됨. +- **정책 변화:** Antigravity 프로젝트의 모든 에이전트 스킬과 데이터 핸들러는 SOLID 원칙을 준수하는 OOP 아키텍처로 설계되어 있어, 새로운 기능 추가 시 기존 코드의 수정 없이 확장이 가능함. ## 🔗 지식 연결 (Graph) -- [[Abstraction]], [[Modularity]], [[Modular-Design]], [[Efficiency]], [[Technical-Architecture]] -- **Modern Tech/Tools**: Java, C++, Python (Class), SOLID principles, Design patterns. ---- +- [[Iterative-Development-Models]], [[Microservices-Architecture]], [[System-Design-for-AI-Scale]], [[Design-Patterns-in-AI]] +- **Raw Source:** [[10_Wiki/Topics/AI/Object-Oriented-Programming.md]] diff --git a/10_Wiki/Topics/AI/Off-policy-vs-On-policy-Learning.md b/10_Wiki/Topics/AI/Off-policy-vs-On-policy-Learning.md new file mode 100644 index 00000000..14c4107a --- /dev/null +++ b/10_Wiki/Topics/AI/Off-policy-vs-On-policy-Learning.md @@ -0,0 +1,27 @@ +--- +id: RL-POLICY-DIFF-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, reinforcement-learning, on-policy, off-policy, q-learning, sarsa] +last_reinforced: 2026-04-26 +--- + +# [[Off-policy vs On-policy Learning (오프-폴리시 vs 온-폴리시 학습)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "현재 내가 걷는 길에서 직접 깨달을 것인가(On), 아니면 타인의 발자취나 과거의 일기에서 진리를 캘 것인가(Off)의 선택" — 에이전트가 학습하는 정책(Target Policy)과 실제로 행동하는 정책(Behavior Policy)의 일치 여부에 따른 강화학습 알고리즘의 분류 체계. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Direct Experience vs Decoupled Learning" — 현재의 무작위 행동이 다음 학습에 즉각 반영되어 안정성을 확보하는 패턴(On-policy)과, 과거의 경험 데이터(Experience Replay)를 재사용하여 데이터 효율성을 극대화하는 패턴(Off-policy) 사이의 전략적 선택. +- **주요 차이점:** + - **On-policy (예: SARSA, PPO):** 자신이 실제로 수행한 행동을 바탕으로 가치를 업데이트. 학습이 안정적이지만 탐색 데이터 낭비가 큼. + - **Off-policy (예: Q-learning, DQN, SAC):** 최적의 행동을 가정하고 업데이트하거나 다른 에이전트의 기록에서도 학습 가능. 데이터 효율성이 압도적으로 높지만 학습이 불안정할 수 있음. +- **의의:** 실제 로봇 제어나 게임 AI 설계 시, 데이터 수집 비용과 학습의 안정성 중 무엇을 우선할지에 대한 핵심 설계 기준이 됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 오프-폴리시가 무조건 효율적이라는 믿음에서 벗어나, 데이터의 분포가 너무 틀어지면 수렴하지 못하는 'Deadly Triad' 문제가 발생할 수 있음을 인지하고, 이를 해결하기 위한 정교한 샘플링 기법(Prioritized Experience Replay 등)이 현대적 정석이 됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 새로운 도구 사용 스킬을 학습시킬 때, 초기에는 오프-폴리시 기반의 대량 시뮬레이션 데이터로 지능을 쌓고, 실전 단계에서는 온-폴리시 기법을 적용하여 안전하고 정교하게 미세 조정한 정책을 수립함. + +## 🔗 지식 연결 (Graph) +- [[Reinforcement-Learning]], [[Markov-Decision-Process-MDP]], [[Experience-Replay-Strategies]], [[Proximal-Policy-Optimization-PPO]] +- **Raw Source:** [[10_Wiki/Topics/AI/Off-policy-vs-On-policy-Learning.md]] diff --git a/10_Wiki/Topics/AI/One-Hot-Encoding.md b/10_Wiki/Topics/AI/One-Hot-Encoding.md new file mode 100644 index 00000000..f802965d --- /dev/null +++ b/10_Wiki/Topics/AI/One-Hot-Encoding.md @@ -0,0 +1,27 @@ +--- +id: DATA-ONEHOT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [machine-learning, data-preprocessing, one-hot-encoding, categorical-data, feature-engineering] +last_reinforced: 2026-04-26 +--- + +# [[One-Hot Encoding (원-핫 인코딩)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터에 존재하지 않는 인위적인 서열(순서)을 배제하고, 각 범주에 오직 단 하나의 빛나는 '1'을 부여하여 평등한 구분을 완성하라" — 범주형 데이터를 컴퓨터가 연산 가능한 이진 벡터(0과 1) 형식으로 변환하여, 데이터 간의 의도치 않은 우선순위 왜곡을 방지하는 전처리 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Binary Categorical Representation" — '빨강=1, 파랑=2, 초록=3' 식으로 숫자를 매길 때 발생하는 '초록이 빨강보다 크다'는 수학적 오류를 막기 위해, 각 범주를 독립적인 차원으로 분리하고 해당되는 칸에만 1을 채우는 평등 변환 패턴. +- **주요 특징:** + - **Equidistance:** 모든 범주 사이의 거리가 동일하게 유지되어 모델의 편향 방지. + - **Dimensionality Increase:** 범주의 수만큼 차원이 늘어나므로, 데이터가 희소(Sparse)해지는 '차원의 저주' 위험 존재. +- **의의:** 선형 회귀, 로지스틱 회귀 등 거리 기반 모델에서 범주형 데이터를 안전하게 처리하기 위한 가장 표준적이고 기초적인 데이터 변환 기법. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 모든 범주형 데이터를 원-핫 인코딩으로 처리하던 방식에서, 이제는 범주가 수만 개 이상인 경우(단어 등) 차원 폭발을 막기 위해 저차원의 밀집 벡터로 압축하는 '임베딩(Embedding)' 기술로 대체되는 경향이 강함. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 액션 타입(Search, Code, Ask 등) 분류 시, 명확한 상호 배타성을 보장하기 위해 원-핫 인코딩을 기본 벡터 표현식으로 사용함. + +## 🔗 지식 연결 (Graph) +- [[Pre-processing-Data-for-AI]], [[Dimensionality-Reduction]], [[Word-Embeddings-Foundations]], [[Feature-Engineering-Best-Practices]] +- **Raw Source:** [[10_Wiki/Topics/AI/One-Hot-Encoding.md]] diff --git a/10_Wiki/Topics/AI/One-Shot-Learning.md b/10_Wiki/Topics/AI/One-Shot-Learning.md new file mode 100644 index 00000000..54b9f7df --- /dev/null +++ b/10_Wiki/Topics/AI/One-Shot-Learning.md @@ -0,0 +1,28 @@ +--- +id: AI-ONE-SHOT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, one-shot-learning, few-shot-learning, siamese-networks, face-recognition] +last_reinforced: 2026-04-26 +--- + +# [[One-Shot Learning (원-샷 학습)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "수만 번의 반복 대신 단 한 번의 조우로 대상을 각인하고, 낯선 환경에서도 즉각적인 통찰을 발휘하라" — 각 카테고리당 단 하나의 학습 샘플만으로도 새로운 데이터를 정확히 분류해내는 고도의 일반화 학습 체계. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Similarity-based Discriminative Learning" — 클래스의 특징을 직접 배우는 대신, 두 데이터가 '얼마나 닮았는지'를 측정하는 법을 배워(Metric Learning), 한 번도 본 적 없는 새로운 클래스가 들어와도 기존 데이터와의 거리 비교를 통해 정체를 파악하는 패턴. +- **주요 기법:** + - **Siamese Networks:** 두 입력을 동일한 네트워크에 통과시켜 출력 벡터 사이의 거리를 최소화/최대화하도록 학습. + - **Matching Networks:** 어텐션 메커니즘을 활용하여 서포트 세트(Support set) 내의 샘플들과 비교. + - **Prototypical Networks:** 각 클래스의 대표 지점(Prototype)을 설정하고 거리 기반 분류 수행. +- **의의:** 얼굴 인식(새로운 사람 등록), 서명 검증 등 데이터 수집이 어렵거나 실시간으로 새로운 카테고리가 추가되는 환경에서 AI의 실용성을 극대화함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 초기에는 특수한 구조(Siamese 등)가 필요했으나, 이제는 거대 언어 모델(LLM)이나 멀티모달 모델이 사전 학습 과정에서 얻은 방대한 지식을 바탕으로 자연스럽게 원-샷/제로-샷 능력을 발휘하는 인-컨텍스트 학습(In-context Learning)이 대세가 됨. +- **정책 변화:** Antigravity 프로젝트는 사용자가 새롭게 정의한 커스텀 명령어(Custom Skill)를 에이전트가 단 한 번의 예시만으로도 정확히 이해하고 실행할 수 있도록 원-샷 프롬프팅 최적화 기술을 적용함. + +## 🔗 지식 연결 (Graph) +- [[Few-Shot-Learning]], [[Meta-Learning-in-AI]], [[Transfer-Learning-Foundations]], [[Distance-Metrics-in-AI]] +- **Raw Source:** [[10_Wiki/Topics/AI/One-Shot-Learning.md]] diff --git a/10_Wiki/Topics/AI/Online-Learning-and-Streaming.md b/10_Wiki/Topics/AI/Online-Learning-and-Streaming.md new file mode 100644 index 00000000..19fc0a41 --- /dev/null +++ b/10_Wiki/Topics/AI/Online-Learning-and-Streaming.md @@ -0,0 +1,28 @@ +--- +id: ML-ONLINE-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [machine-learning, online-learning, streaming-data, incremental-learning, real-time-ai, mlops] +last_reinforced: 2026-04-26 +--- + +# [[Online Learning and Streaming (온라인 학습과 스트리밍)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 유효기간이 지나기 전에 학습하고, 멈추지 않는 정보의 강물(Stream) 위에서 지능을 실시간으로 진화시켜라" — 대규모 데이터를 한꺼번에 처리하는 대신, 순차적으로 들어오는 데이터 샘플이나 미니 배치를 즉시 모델에 반영하여 최신 상태를 유지하는 학습 패러다임. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Sequential Update and Concept Drift Adaptation" — 모델 전체를 다시 학습시키는 비용을 들이지 않고, 새로운 데이터가 들어올 때마다 가중치를 조금씩 수정(Incremental Update)함으로써 급변하는 데이터 분포(Concept Drift)에 즉각적으로 대응하는 패턴. +- **핵심 기술:** + - **Stochastic Gradient Descent (SGD):** 한 번에 하나의 샘플로 가중치를 업데이트하는 온라인 학습의 기본 최적화 도구. + - **Sliding Window:** 최신 데이터에 더 높은 비중을 두고 과거 데이터를 점진적으로 망각. + - **Stream Processing (Kafka, Flink):** 대규모 데이터 스트림을 저지연으로 수집하고 처리하는 인프라. +- **의의:** 서버 자원이 한정적이거나 데이터가 너무 커서 전체를 저장할 수 없는 경우, 그리고 실시간 추천이나 이상 탐지처럼 '지금 당장'의 판단이 중요한 분야의 필수 기술. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 온라인 학습은 데이터 노이즈에 너무 민감하게 반응하여 학습이 요동칠 수 있다는 문제가 있었으나, 최근에는 안정적인 모멘텀 기법과 모델 평균화(Model Averaging)를 통해 실전에서도 높은 견고함을 확보함. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 사용자 개인화 프로필 업데이트 시, 전체 재학습 대신 온라인 학습 기법을 적용하여 사용자의 최신 선호도를 즉각 반영함. + +## 🔗 지식 연결 (Graph) +- [[Model-Drift-and-Monitoring]], [[Incremental-Learning]], [[Message-Queues-and-Event-Streams]], [[Real-time-Data-Processing]] +- **Raw Source:** [[10_Wiki/Topics/AI/Online-Learning-and-Streaming.md]] diff --git a/10_Wiki/Topics/AI/Ontology-and-Knowledge-Representation.md b/10_Wiki/Topics/AI/Ontology-and-Knowledge-Representation.md new file mode 100644 index 00000000..c56fdffc --- /dev/null +++ b/10_Wiki/Topics/AI/Ontology-and-Knowledge-Representation.md @@ -0,0 +1,29 @@ +--- +id: AI-ONT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, knowledge-representation, ontology, semantic-web, reasoning, knowledge-graph] +last_reinforced: 2026-04-26 +--- + +# [[Ontology and Knowledge Repr (온톨로지와 지식 표현)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터에 이름표를 붙이는 단계를 넘어, 존재들 사이의 본질적 관계와 질서를 규명하여 기계의 '상식'을 설계하라" — 지식의 개념들을 정의하고, 이들 사이의 관계(속성, 계층)를 기계가 해석하고 추론할 수 있는 형식적인 언어로 표현하는 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Formal Semantic Mapping" — "사람은 포유류이다", "서울은 한국의 수도이다"와 같은 명제들을 RDF(Resource Description Framework)나 OWL(Web Ontology Language) 같은 표준 규격으로 구조화하여, 명시되지 않은 정보까지 논리적으로 유추(Reasoning)할 수 있게 하는 패턴. +- **핵심 구성 요소:** + - **Classes (Concepts):** 사물의 범주 (예: 자동차, 도시). + - **Properties (Relations):** 객체 간의 연결 (예: ~에 속해 있다, ~의 원인이다). + - **Individuals (Instances):** 구체적인 사례 (예: 현대 쏘나타, 서울시). + - **Axioms:** 논리적 제약 조건 (예: 모든 수도는 도시이다). +- **의의:** 딥러닝이 놓치기 쉬운 '논리적 인과관계'와 '상식적 추론'을 보완하며, 지식 그래프(Knowledge Graph)의 설계도 역할을 수행함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 인간이 모든 규칙을 직접 작성하던 방식(Top-down)의 한계를 극복하기 위해, 최근에는 거대 언어 모델이 텍스트에서 자동으로 온톨로지를 추출하고 확장하는 '온톨로지 학습(Ontology Learning)' 기법이 접목되고 있음. +- **정책 변화:** Antigravity 프로젝트는 1,174개의 위키 지식을 단순 연결하는 것을 넘어, 각 주제 간의 상하 관계와 연관 관계를 엄격히 정의한 커스텀 온톨로지를 구축하여 에이전트의 지식 탐색 정확도를 높임. + +## 🔗 지식 연결 (Graph) +- [[Knowledge-Graph-Foundations]], [[Neuro-Symbolic-AI]], [[Linguistic-Analysis-in-AI]], [[Semantic-Web-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Ontology-and-Knowledge-Representation.md]] diff --git a/10_Wiki/Topics/AI/Open-Source-AI-Ecosystem.md b/10_Wiki/Topics/AI/Open-Source-AI-Ecosystem.md new file mode 100644 index 00000000..5cf7a246 --- /dev/null +++ b/10_Wiki/Topics/AI/Open-Source-AI-Ecosystem.md @@ -0,0 +1,29 @@ +--- +id: AI-OS-ECO-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, open-source, hugging-face, llama, mistral, community-driven, democratization] +last_reinforced: 2026-04-26 +--- + +# [[Open-Source AI Ecosystem (오픈소스 AI 생태계)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "지능을 소유하지 않고 공유함으로써, 전 인류의 집단 지성이 거대 기업의 벽을 넘어서는 혁신의 가속도를 창출하라" — AI 모델, 데이터셋, 프레임워크를 공개적으로 공유하고 협업하여 기술의 민주화와 투명성을 실현하는 전 세계적 개발 커뮤니티와 인프라의 집합체. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Collaborative Innovation and Rapid Iteration" — 소수의 폐쇄적인 연구실 대신, 허깅페이스(Hugging Face)와 같은 허브를 통해 모델을 공유하고 깃허브에서 코드를 개선하며, 전 세계 개발자들이 단 며칠 만에 새로운 기술을 최적화하고 배포하는 초고속 혁신 패턴. +- **핵심 주체 및 자산:** + - **Frameworks:** PyTorch, TensorFlow, Scikit-learn 등 기술적 토대. + - **Models (Open Weights):** Llama (Meta), Mistral, Gemma (Google) 등 강력한 기본 모델. + - **Platforms:** Hugging Face (모델/데이터 허브), GitHub (코드 협업). + - **Communities:** 다양한 파인튜닝 기법(LoRA 등)과 양자화 모델을 배포하는 독립 연구 그룹들. +- **의의:** 특정 기업에 대한 기술 종속성을 줄이고, 개인정보 보호를 위한 로컬 AI 구축을 가능케 하며, 기술의 안전성을 전 세계가 함께 검증하는 '투명한 지능'의 실현. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 오픈소스 AI는 성능이 뒤처질 것이라는 과거의 편견을 깨고, 최근에는 수많은 커뮤니티의 최적화 노력이 결합되어 특정 벤치마크에서 상용 모델에 필적하거나 오히려 능가하는 결과를 내놓고 있음. +- **정책 변화:** Antigravity 프로젝트는 보안과 비용 효율성을 위해 로컬 환경에서 구동 가능한 오픈소스 모델(Llama 3 등)을 적극 도입하며, 커뮤니티의 최신 최적화 기법을 즉각 수용하여 시스템 성능을 개선함. + +## 🔗 지식 연결 (Graph) +- [[PyTorch-Foundations]], [[Low-Rank-Adaptation-LoRA]], [[Hugging-Face-Integration]], [[Local-Brain-Management]] +- **Raw Source:** [[10_Wiki/Topics/AI/Open-Source-AI-Ecosystem.md]] diff --git a/10_Wiki/Topics/AI/OpenAI-API-Integration.md b/10_Wiki/Topics/AI/OpenAI-API-Integration.md new file mode 100644 index 00000000..5b04dc4c --- /dev/null +++ b/10_Wiki/Topics/AI/OpenAI-API-Integration.md @@ -0,0 +1,29 @@ +--- +id: AI-OPENAI-API-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, openai, api, llm, integration, development, gpt-4] +last_reinforced: 2026-04-26 +--- + +# [[OpenAI API Integration (OpenAI API 통합)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "거대 모델의 지능을 단 몇 줄의 API 호출로 내 서비스의 심장에 이식하고, 기계와 인간의 대화를 비즈니스 가치로 변환하라" — OpenAI가 제공하는 최첨단 AI 모델(GPT, DALL-E, Whisper 등)을 외부 애플리케이션에 연결하여 텍스트 생성, 분석, 이미지 처리 등의 기능을 구현하는 개발 인터페이스. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Stateless Interaction and Structured Prompting" — 모델의 상태를 직접 관리하지 않고, 이전 대화 내용(History)을 포함한 프롬프트를 전송하여 문맥에 맞는 응답을 받아내는 비상태성 통신 패턴. 특히 최근에는 JSON 모드나 함수 호출(Function Calling)을 통해 결과를 정형 데이터로 받아 시스템 제어에 활용함. +- **주요 엔드포인트:** + - **Chat Completions (gpt-4o, gpt-3.5-turbo):** 텍스트 기반 대화 및 추론. + - **Embeddings:** 텍스트를 벡터로 변환하여 검색 및 클러스터링에 활용. + - **Audio (Whisper, TTS):** 음성 인식 및 합성. + - **Images (DALL-E 3):** 이미지 생성 및 편집. +- **의의:** 복잡한 인프라 구축 없이 누구나 고도화된 지능형 서비스를 즉각 배포할 수 있게 하여, 전 세계적인 AI 앱 서비스(SaaS)의 폭발적 성장을 견인함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 텍스트를 주고받던 단계를 넘어, 이제는 외부 도구를 호출하는 도구 사용(Tool Use) 능력과 파일 기반 지식 참조(Assistants API) 등 개발자의 역할을 코딩에서 '오케스트레이션'으로 전환시키고 있음. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 고도의 추론이 필요한 구간에서 OpenAI API를 최적화된 프롬프트 엔지니어링과 함께 사용하여, 로컬 모델이 해결하기 어려운 복잡한 논리 문제를 해결함. + +## 🔗 지식 연결 (Graph) +- [[GPT-Architecture-Foundations]], [[Prompt-Engineering-Best-Practices]], [[RAG-Foundations]], [[Local-Brain-Management]] +- **Raw Source:** [[10_Wiki/Topics/AI/OpenAI-API-Integration.md]] diff --git a/10_Wiki/Topics/AI/Operations-Management.md b/10_Wiki/Topics/AI/Operations-Management.md new file mode 100644 index 00000000..82ce4211 --- /dev/null +++ b/10_Wiki/Topics/AI/Operations-Management.md @@ -0,0 +1,29 @@ +--- +id: MGMT-OPS-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [management, operations, process-optimization, efficiency, supply-chain, agile] +last_reinforced: 2026-04-26 +--- + +# [[Operations Management (운영 관리)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "비즈니스의 투입(Input)을 가치 있는 산출(Output)로 전환하는 모든 과정을 최적화하여, 낭비 없는 성장의 엔진을 구축하라" — 제품이나 서비스를 생산하고 전달하는 전체 프로세스를 설계, 실행, 제어하여 효율성과 고객 만족도를 극대화하는 관리 전략. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Process Refinement and Resource Allocation" — 병목 현상을 식별하여 제거하고, 한정된 자원(시간, 인력, 자본)을 최적의 지점에 배분함으로써 생산성을 높이고 비용을 절감하는 체계적인 운영 패턴. +- **핵심 요소:** + - **Inventory Management:** 재고 비용과 기회비용 사이의 균형 유지. + - **Quality Control:** 일관된 품질을 보장하기 위한 통계적 프로세스 관리. + - **Supply Chain Management:** 원재료 수급부터 최종 전달까지의 전체 흐름 최적화. + - **Capacity Planning:** 수요 예측을 바탕으로 한 생산 능력 조절. +- **의의:** 좋은 아이디어를 실제 시장에서 지속 가능한 비즈니스 모델로 정착시키는 핵심 실행 동력이며, AI 시대에는 데이터 파이프라인의 운영(MLOps)으로 그 영역이 확장됨. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 정적인 공정 최적화에 머물던 과거와 달리, 현대 운영 관리는 애자일(Agile) 방법론과 AI 기반의 실시간 수요 예측을 결합하여 변화하는 시장에 즉각 대응하는 유연성을 핵심 가치로 삼음. +- **정책 변화:** Antigravity 프로젝트는 1,174개의 지식 가드닝 작업을 '배치 처리'와 '실시간 동기화'로 나누어 관리함으로써, 한정된 연산 자원 내에서 최대의 지식 보강 효율을 도출하는 운영 최적화 전략을 수행함. + +## 🔗 지식 연결 (Graph) +- [[Lean-Project-Management]], [[Minimum-Viable-Product-MVP]], [[Agile-Methodologies]], [[System-Design-for-AI-Scale]] +- **Raw Source:** [[10_Wiki/Topics/AI/Operations-Management.md]] diff --git a/10_Wiki/Topics/AI/Optical-Character-Recognition.md b/10_Wiki/Topics/AI/Optical-Character-Recognition.md index 812800a6..46131dee 100644 --- a/10_Wiki/Topics/AI/Optical-Character-Recognition.md +++ b/10_Wiki/Topics/AI/Optical-Character-Recognition.md @@ -1,31 +1,28 @@ --- -id: P-REINFORCE-AUTO-OOCR-001 +id: CV-OCR-001 category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.97 -tags: [auto-reinforced, ocr, computer-vision, pattern-recognition, digitization, documented-intelligence] -last_reinforced: 2026-04-20 +confidence_score: 1.0 +tags: [ai, computer-vision, ocr, text-recognition, deep-learning, tesseract] +last_reinforced: 2026-04-26 --- -# [[Optical-Character-Recognition]] +# [[Optical Character Recognition (OCR, 광학 문자 인식)]] ## 📌 한 줄 통찰 (The Karpathy Summary) -> "이미지에서 지식을 채굴하다: 사진이나 스캔 문서 속의 글자 이미지를 기계가 읽을 수 있는 텍스트 데이터로 변환하여, 먼지 쌓인 종이 뭉치를 검색 가능한 지식의 보고로 부활시키는 컴퓨터 비전의 첫 번째 결실." +> "픽셀의 덩어리에서 언어의 형상을 발견하고, 물리적 세상의 기록을 디지털 지식의 흐름으로 복원하라" — 이미지나 스캔된 문서 내의 텍스트를 식별하여 컴퓨터가 편집하고 검색할 수 있는 텍스트 데이터로 변환하는 기술. ## 📖 구조화된 지식 (Synthesized Content) -광학 문자 인식(OCR)은 이미지 형태의 문자를 디지털 텍스트로 인식하는 기술입니다. - -1. **3대 단계**: - * **Pre-processing**: 이미지 잡음 제거 및 글자 정렬. (Noise와 연결) - * **Recognition**: 획의 패턴이나 특징을 추출하여 어떤 글자인지 판별. (Deep Learning (DL)와 연결) - * **Post-processing**: 사전(Dictionary)을 대조하여 문맥상 어색한 오타 수정. -2. **왜 중요한가?**: - * 아날로그 세계의 지식을 디지털 지식 구조로 이전하는 '입구' 역할을 하며, 영수증 자동 처리, 자동차 번호판 인식 등 실생활 자동화의 핵심임. (Efficiency와 연결) +- **추출된 패턴:** "Localization, Recognition, and Linguistic Refinement" — 먼저 글자가 어디에 있는지 영역을 찾고(Detection), 각 영역의 이미지를 문자로 번역하며(Recognition), 언어 모델을 통해 문맥상 자연스러운 단어로 교정하는 3단계 처리 패턴. +- **주요 기술적 진화:** + - **Classic OCR (Tesseract):** 정해진 폰트와 깔끔한 배경 위주로 작동. + - **Deep Learning OCR (CRNN, Transformer):** 비정형 배경, 휘어진 텍스트, 다양한 필체 인식 가능. + - **Scene Text Recognition:** 자연 환경 속 간판이나 사물의 텍스트 탐지. +- **의의:** 방대한 종이 문서의 디지털화(Digital Transformation)를 가능케 하며, 자율주행차의 표지판 인식, 번역 앱의 실시간 텍스트 치환 등 실생활 지능의 필수 관문 역할. ## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌**: 과거에는 정해진 폰트만 읽는 '템플릿 매칭 정책'이었으나, 현대 정책은 손글씨나 복잡한 배경 속 글자까지 읽어내는 '딥러닝 기반 지능형 OCR(IDP) 정책'으로 진화함(RL Update). -- **정책 변화(RL Update)**: 최근에는 단순히 글자만 읽는 정책을 넘어, 문서의 레이아웃과 서식의 의미 정책까지 파악하는 '문서 이해(Document AI) 정책'으로 확장되어 멀티모달 모델의 핵심 기능 정책으로 편입됨. (Multimodal-Learning와 연결) +- **과거 데이터와의 충돌:** 단순히 '글자 하나하나'를 맞히는 단계를 넘어, 이제는 문서의 레이아웃(표, 리스트 등)까지 파악하여 구조화된 JSON/Markdown으로 변환하는 Layout Analysis 기술이 현대 OCR의 핵심 경쟁력이 됨. +- **정책 변화:** Antigravity 프로젝트는 외부 데이터 수집 시 이미지나 PDF 내의 텍스트를 지식화하기 위해, 최신 트랜스포머 기반 OCR 엔진을 활용하여 높은 정확도의 텍스트 추출을 보장함. ## 🔗 지식 연결 (Graph) -- [[Computer Vision]], [[Deep Learning (DL)]], [[Noise]], [[Multimodal-Learning]], [[Efficiency]] -- **Modern Tech/Tools**: Tesseract, Google Cloud Vision, Amazon Textract, ABBYY FineReader, LayoutLM. ---- +- [[Computer-Vision-Foundations]], [[Natural-Language-Processing-NLP]], [[Object-Detection-Foundations]], [[Image-Segmentation]] +- **Raw Source:** [[10_Wiki/Topics/AI/Optical-Character-Recognition.md]] diff --git a/10_Wiki/Topics/AI/Optimal-Control-Theory.md b/10_Wiki/Topics/AI/Optimal-Control-Theory.md new file mode 100644 index 00000000..83262aa3 --- /dev/null +++ b/10_Wiki/Topics/AI/Optimal-Control-Theory.md @@ -0,0 +1,28 @@ +--- +id: MATH-OPT-CTRL-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [math, control-theory, optimal-control, bellman-equation, reinforcement-learning, robotics] +last_reinforced: 2026-04-26 +--- + +# [[Optimal Control Theory (최적 제어 이론)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "한정된 에너지를 가장 영리하게 사용하여, 시스템이 목표한 궤도에 가장 우아하게 도달하게 하라" — 시간에 따라 변화하는 동적 시스템의 거동을 제어하여, 특정 목적 함수(Cost Function)를 최소화하거나 이득을 최대화하는 최적의 제어 법칙을 찾아내는 수학적 이론. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Trajectory Optimization and Dynamic Programming" — 시스템의 현재 상태와 물리적 제약 조건을 고려하여 미래의 일련의 행동들을 계획하고, 벨만 방정식(Bellman Equation)이나 폰트랴긴의 최대 원리를 통해 최선의 경로를 산출하는 제어 패턴. +- **핵심 개념:** + - **LQR (Linear Quadratic Regulator):** 선형 시스템에서 오차의 제곱합을 최소화하는 표준 제어 기법. + - **MPC (Model Predictive Control):** 미래의 일정 구간을 예측하여 매 순간 최적의 입력을 다시 계산하는 실시간 제어 방식. + - **Hamiltonian:** 시스템의 에너지 보존과 변화율을 다루는 핵심 물리 수식. +- **의의:** 강화학습(RL)의 근간이 되는 이론적 토대이며, 자율주행, 항공우주, 드론 제어 등 물리적 실체가 있는 AI 시스템의 필수 학문. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 모든 물리 수식을 완벽히 알아야 했던 과거의 모델 기반 제어(Model-based)에서, 이제는 수식을 몰라도 데이터를 통해 제어 규칙을 배우는 강화학습 기반의 데이터 주도 제어(Data-driven)와 결합하여 적응력이 극대화됨. +- **정책 변화:** Skybound 프로젝트의 미사일 궤적 최적화 및 에이전트의 자원 배분 시나리오 설계 시, 최적 제어 이론의 비용 함수 설계 원칙을 준수하여 시스템의 안정성을 확보함. + +## 🔗 지식 연결 (Graph) +- [[Reinforcement-Learning]], [[Monte-Carlo-Tree-Search-MCTS]], [[Markov-Decision-Process-MDP]], [[Fluid-Dynamics]] +- **Raw Source:** [[10_Wiki/Topics/AI/Optimal-Control-Theory.md]] diff --git a/10_Wiki/Topics/AI/Optimization-Algorithms.md b/10_Wiki/Topics/AI/Optimization-Algorithms.md new file mode 100644 index 00000000..c1976610 --- /dev/null +++ b/10_Wiki/Topics/AI/Optimization-Algorithms.md @@ -0,0 +1,30 @@ +--- +id: MATH-OPT-ALGO-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [math, algorithms, optimization, heuristic, simulated-annealing, genetic-algorithms] +last_reinforced: 2026-04-26 +--- + +# [[Optimization Algorithms (최적화 알고리즘)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "가능성의 숲에서 가장 깊은 골짜기(최소 비용)를 찾기 위해, 때로는 눈앞의 내리막을 걷고 때로는 과감한 도약으로 산맥을 넘으라" — 주어진 제약 조건 하에서 목적 함수의 값을 최대로 하거나 최소로 만드는 변수들의 최적 조합을 효율적으로 탐색하는 알고리즘들의 총칭. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Iterative Improvement and Search Space Exploration" — 현재 상태에서 조금씩 더 나은 방향으로 이동하거나(Local Search), 무작위성을 부여하여 지역 최적해(Local Minima)에서 탈출하며 전역 최적해를 향해 나아가는 탐색 패턴. +- **주요 알고리즘 분류:** + - **Gradient-based:** 함수를 미분하여 기울기 방향으로 이동 (SGD, Adam 등). 연속적인 공간에 최적. + - **Meta-heuristics:** 자연 현상을 모방한 범용 탐색법. + - **Simulated Annealing:** 확률적 도약을 통해 지역 최적해 탈출. + - **Genetic Algorithms:** 교배와 변이를 통한 진화적 탐색. + - **Particle Swarm Optimization:** 집단의 정보를 공유하며 최적점 추적. +- **의의:** AI 모델 학습뿐만 아니라 물류 경로 최적화, 반도체 설계, 금융 포트폴리오 구성 등 모든 공학적 의사결정의 핵심 도구. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 항상 전역 최적해를 찾아야 한다는 집착에서 벗어나, 현실적인 시간 내에 충분히 훌륭한 해(Sub-optimal solution)를 찾는 '휴리스틱'의 가치가 현대 대규모 복잡계 최적화의 주류로 자리 잡음. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 스케줄링 및 리소스 할당 시, 문제의 성격에 따라 정교한 수리 계획법(Linear Programming)과 유연한 메타 휴리스틱 알고리즘을 혼합하여 사용함. + +## 🔗 지식 연결 (Graph) +- [[Optimization-in-AI]], [[Gradient-Descent-Foundations]], [[Genetic-Algorithms]], [[Hyperparameter-Optimization]] +- **Raw Source:** [[10_Wiki/Topics/AI/Optimization-Algorithms.md]] diff --git a/10_Wiki/Topics/AI/Optimization-in-AI.md b/10_Wiki/Topics/AI/Optimization-in-AI.md new file mode 100644 index 00000000..26173ebb --- /dev/null +++ b/10_Wiki/Topics/AI/Optimization-in-AI.md @@ -0,0 +1,28 @@ +--- +id: AI-OPT-CORE-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, optimization, loss-function, training, convergence] +last_reinforced: 2026-04-26 +--- + +# [[Optimization in AI (AI에서의 최적화)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 바다에서 모델의 '오답'을 최소화하는 최적의 가중치를 발굴하여, 기계의 계산을 지능의 통찰로 승화시켜라" — 신경망 모델의 예측값과 실제값 사이의 오차(Loss)를 줄이기 위해 모델의 파라미터를 반복적으로 조정하여 최적의 성능을 끌어내는 과정. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Empirical Risk Minimization and Gradient Flow" — 주어진 학습 데이터에 대해 손실 함수의 기울기를 따라가며 위험을 최소화하는 동시에, 보지 못한 데이터에도 잘 작동하도록 일반화(Generalization) 성능을 확보하는 균형 잡힌 최적화 패턴. +- **AI 최적화의 3대 요소:** + - **Objective Function (Loss):** 줄여야 할 목표 (예: MSE, Cross Entropy). + - **Optimizer:** 어떻게 줄일 것인가 (예: SGD, Adam, RMSProp). + - **Regularization:** 너무 지나치게 학습하지 않도록 제어 (예: Dropout, Weight Decay). +- **의의:** AI 모델이 단순한 수식의 나열에서 학습을 통해 '능력'을 획득하게 만드는 실질적인 지능 구현의 심장. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 학습 오차를 0으로 만드는 것이 목표였던 시절을 지나, 이제는 '평평한 최적점(Flat Minima)'을 찾아야 모델의 일반화 성능이 좋아진다는 관점이 정립되어 이를 유도하는 최적화 기법(SAM 등)이 주목받고 있음. +- **정책 변화:** Antigravity 프로젝트는 대규모 언어 모델 학습 시, 수렴 속도와 최종 성능의 균형을 위해 학습률 스케줄링(Learning Rate Scheduling)과 AdamW 최적화 도구를 결합한 표준 파이프라인을 가동함. + +## 🔗 지식 연결 (Graph) +- [[Optimization-Algorithms]], [[Gradient-Descent-Foundations]], [[Loss-Functions-Foundations]], [[Hyperparameter-Optimization]] +- **Raw Source:** [[10_Wiki/Topics/AI/Optimization-in-AI.md]] diff --git a/10_Wiki/Topics/AI/Ordinal-Data-Analysis.md b/10_Wiki/Topics/AI/Ordinal-Data-Analysis.md new file mode 100644 index 00000000..a895d71b --- /dev/null +++ b/10_Wiki/Topics/AI/Ordinal-Data-Analysis.md @@ -0,0 +1,27 @@ +--- +id: DATA-ORD-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [statistics, data-analysis, ordinal-data, categorical-data, machine-learning, feature-engineering] +last_reinforced: 2026-04-26 +--- + +# [[Ordinal Data Analysis (순서형 데이터 분석)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터 사이의 상대적인 '순서'와 '계층'을 보존하되, 그 간격이 일정하지 않음을 인정하며 통계적 질서를 세우라" — 범주(Category)들 사이에 명확한 순위나 등급이 존재하지만, 각 단계 사이의 수치적 거리가 일정하지 않은 데이터를 분석하고 처리하는 통계적 방법론. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Order-preserving Encoding and Rank Statistics" — '매우 만족(5), 만족(4), 보통(3)...'과 같이 순서 정보가 중요한 데이터를 처리할 때, 단순 범주형으로 취급하여 순서를 잃지 않으면서도 수치형처럼 거리 연산을 오용하지 않도록 순위 기반의 통계 기법(Spearman's Rho 등)이나 서열 인코딩(Ordinal Encoding)을 적용하는 패턴. +- **주요 특징:** + - **Relative Ranking:** 순서 관계($1 < 2 < 3$)는 명확함. + - **Variable Intervals:** $2-1$의 의미와 $3-2$의 의미가 수학적으로 동일하지 않음. +- **의의:** 고객 만족도 조사, 신용 등급 분류, 질병의 중증도 단계 등 실생활에서 흔히 접하는 계층적 정보를 AI 모델이 왜곡 없이 학습하게 하는 필수 전처리 지식. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 순서형 데이터를 단순히 수치형으로 변환하여 평균을 내는 오류를 범하기 쉬우나, 현대 분석에서는 누적 로짓 모델(Cumulative Logit Model) 등을 사용하여 순서형 데이터의 본질적 특성을 보존하는 모델링을 수행함. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 결과에 대한 사용자 피드백(1~5점 척도)을 분석할 때, 산술 평균뿐만 아니라 순위 기반의 분포 분석을 병행하여 정교한 성능 개선 지표를 도출함. + +## 🔗 지식 연결 (Graph) +- [[Pre-processing-Data-for-AI]], [[One-Hot-Encoding]], [[Exploratory-Data-Analysis]], [[Feature-Engineering-Best-Practices]] +- **Raw Source:** [[10_Wiki/Topics/AI/Ordinal-Data-Analysis.md]] diff --git a/10_Wiki/Topics/AI/Out-of-distribution-Detection.md b/10_Wiki/Topics/AI/Out-of-distribution-Detection.md new file mode 100644 index 00000000..a787c0d3 --- /dev/null +++ b/10_Wiki/Topics/AI/Out-of-distribution-Detection.md @@ -0,0 +1,28 @@ +--- +id: AI-OOD-DET-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, ood-detection, reliability, anomaly-detection, trustworthy-ai] +last_reinforced: 2026-04-26 +--- + +# [[Out-of-distribution Detection (분포 외 데이터 탐지)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "모르는 것을 모른다고 말할 줄 아는 정직함이 AI의 지능을 완성하며, 시스템의 치명적인 오판을 막는 최후의 보루가 된다" — 모델이 학습한 데이터 분포(In-distribution)와 확연히 다른 데이터(Out-of-distribution)가 입력되었을 때, 이를 식별하여 예측의 신뢰도를 관리하는 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Uncertainty Quantification and Reject Option" — 모델의 출력 확률(Confidence)이 낮거나 특징 공간에서의 거리가 멀 때, 해당 입력을 '신뢰할 수 없음'으로 분류하고 처리를 거부하거나 인간에게 넘기는 방어적 지능 패턴. +- **주요 기법:** + - **Softmax-based:** 출력층의 최대 확률값이 임계치보다 낮으면 OOD로 간주. + - **Energy-based Models:** 데이터의 에너지(부정합성) 수치를 계산하여 탐지. + - **Generative Approach:** 데이터를 생성 모델에 통과시켜 복원 오차가 크면 OOD로 판단. +- **의의:** 자율주행차의 미학습 장애물 인식, 의료 AI의 희귀 질환 판단 등 안전이 직결된 분야에서 모델의 과잉 확신(Overconfidence)을 억제하고 신뢰할 수 있는 AI(Trustworthy AI)를 구현함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 성능을 높이는 것에만 집중하던 단계에서, 이제는 성능만큼이나 '자신의 한계를 아는 능력'이 모델 평가의 핵심 지표로 부상함. +- **정책 변화:** Antigravity 프로젝트는 에이전트가 처리 불가능한 복잡하거나 위험한 요청을 받았을 때, 내부적인 OOD 탐지 레이어를 거쳐 "현재 권한으로 수행할 수 없는 작업"임을 명확히 안내하고 상위 프로세스로 보고함. + +## 🔗 지식 연결 (Graph) +- [[Outlier-Detection-Techniques]], [[Trustworthy-AI]], [[Probability-Theory]], [[Generative-Adversarial-Networks-GAN]] +- **Raw Source:** [[10_Wiki/Topics/AI/Out-of-distribution-Detection.md]] diff --git a/10_Wiki/Topics/AI/Outlier-Detection-Techniques.md b/10_Wiki/Topics/AI/Outlier-Detection-Techniques.md new file mode 100644 index 00000000..c5cd03d3 --- /dev/null +++ b/10_Wiki/Topics/AI/Outlier-Detection-Techniques.md @@ -0,0 +1,29 @@ +--- +id: ML-OUT-DET-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [machine-learning, outlier-detection, anomaly-detection, statistics, isolation-forest, data-quality] +last_reinforced: 2026-04-26 +--- + +# [[Outlier Detection Techniques (이상치 탐지 기법)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "대다수의 흐름에서 벗어난 소수의 '튀는 데이터'를 식별하여, 시스템의 오류를 미연에 방지하거나 숨겨진 위협을 포착하라" — 데이터 전체의 통계적 경향성에서 크게 벗어나 데이터의 질을 떨어뜨리거나 부정적 이벤트를 암시하는 이상치(Outliers)를 탐색하는 방법론. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Deviation and Isolation Analysis" — 정상 데이터가 밀집된 영역을 정의하고 그 밖의 데이터를 찾거나(Z-score, IQR), 정상 데이터보다 훨씬 적은 횟수의 질문만으로도 고립(Isolation)되는 데이터를 이상치로 분류하는 패턴. +- **주요 기법:** + - **Statistical:** Z-score(표준편차 활용), IQR(사분위수 활용). 정규분포를 가정할 때 효과적. + - **Distance-based (KNN):** 주변 이웃과의 거리가 먼 데이터를 이상치로 판단. + - **Density-based (LOF):** 주변 데이터 밀도가 상대적으로 낮은 지점을 탐지. + - **Isolation Forest:** 데이터를 무작위로 분할할 때 빨리 고립되는 지점을 찾는 현대적 표준. +- **의의:** 신용카드 부정 결제 감지, 공장 설비 고장 예지, 데이터 전처리 단계의 노이즈 제거 등 시스템의 신뢰성을 지탱하는 핵심 모니터링 기술. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 모든 이상치를 '제거해야 할 오류'로 보던 단계에서, 이제는 이상치 자체가 가장 중요한 정보를 담고 있는 '이벤트(Fraud 등)'라는 인식으로 전환되어 정교한 분석의 대상이 됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 연산 리소스 사용량이 평소 분포를 크게 벗어날 때, Isolation Forest 기반의 이상 탐지 엔진을 가동하여 비정상적인 루프나 해킹 시도를 실시간으로 차단함. + +## 🔗 지식 연결 (Graph) +- [[Out-of-distribution-Detection]], [[Pre-processing-Data-for-AI]], [[Clustering-Algorithms-Foundations]], [[High-Availability-Systems]] +- **Raw Source:** [[10_Wiki/Topics/AI/Outlier-Detection-Techniques.md]] diff --git a/10_Wiki/Topics/AI/Overfitting-and-Underfitting.md b/10_Wiki/Topics/AI/Overfitting-and-Underfitting.md new file mode 100644 index 00000000..4d14c4f8 --- /dev/null +++ b/10_Wiki/Topics/AI/Overfitting-and-Underfitting.md @@ -0,0 +1,27 @@ +--- +id: ML-FIT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [machine-learning, overfitting, underfitting, bias-variance-tradeoff, regularization, generalization] +last_reinforced: 2026-04-26 +--- + +# [[Overfitting and Underfitting (과적합과 과소적합)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터를 통째로 외우는 '편협함'과 본질조차 파악 못 하는 '무지' 사이의 좁은 길(Generalization)을 찾아라" — 모델이 학습 데이터에 너무 과하게 맞추어져 실전에서 성능이 떨어지는 현상(Overfitting)과, 데이터의 기본 패턴조차 제대로 학습하지 못한 현상(Underfitting). + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Bias-Variance Tradeoff" — 모델이 단순할수록 발생하는 '편향(Bias)' 에러와 모델이 복잡할수록 발생하는 '분산(Variance)' 에러 사이의 총합을 최소화하여, 보지 못한 데이터에 대해서도 높은 성능을 유지하게 만드는 일반화 패턴. +- **주요 해결책:** + - **Overfitting 해결:** 데이터 증강(Augmentation), 규제(L1/L2), 드롭아웃(Dropout), 조기 종료(Early Stopping). 모델을 더 '차분하게' 만듦. + - **Underfitting 해결:** 모델 복잡도 증가, 더 많은 학습 반복, 특징 공학(Feature Engineering)을 통한 정보 보강. 모델을 더 '똑똑하게' 만듦. +- **의의:** AI 모델의 성능을 평가할 때 단순한 정확도가 아닌 '학습 곡선(Learning Curve)'을 통해 모델의 현재 상태를 진단하고 처방을 내리는 결정적인 기준. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 과적합은 무조건 피해야 할 악으로 여겨졌으나, 최근 초거대 모델(LLM)에서는 학습 데이터를 완전히 외우는 단계를 넘어 더 학습시킬 때 오히려 일반화 성능이 다시 좋아지는 '더블 디센트(Double Descent)' 현상이 발견되어 최적화 전략의 패러다임이 변하고 있음. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 학습 과정에서 검증 오차(Validation Loss)가 상승하는 지점을 실시간 모니터링하여, 최적의 일반화 시점에서 학습을 종료하는 자동 조기 종료 프로토콜을 적용함. + +## 🔗 지식 연결 (Graph) +- [[Normalization-Strategies]], [[Cross-Validation-Techniques]], [[Hyperparameter-Optimization]], [[Loss-Functions-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Overfitting-and-Underfitting.md]] diff --git a/10_Wiki/Topics/AI/P-Reinforce-Template-Guide.md b/10_Wiki/Topics/AI/P-Reinforce-Template-Guide.md new file mode 100644 index 00000000..c3eab06b --- /dev/null +++ b/10_Wiki/Topics/AI/P-Reinforce-Template-Guide.md @@ -0,0 +1,31 @@ +--- +id: AG-TPL-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [antigravity, p-reinforce, knowledge-gardening, template-guide, pkm, documentation-standard] +last_reinforced: 2026-04-26 +--- + +# [[P-Reinforce Template Guide (P-Reinforce 템플릿 가이드)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "지식의 복잡성을 제거하고 정제된 고밀도의 통찰만을 남겨, 에이전트와 인간이 즉각적으로 공명할 수 있는 '지식의 표준 규격'을 확립하라" — Antigravity 프로젝트의 모든 지식 문서를 Karpathy Summary 스타일로 보강하고 연결하기 위한 공식 구조 및 서술 가이드라인. + +## 📖 구조화된 지식 (Synthesized Content) +- **템플릿 4대 핵심 섹션:** + 1. **📌 한 줄 통찰 (The Karpathy Summary):** 주제의 본질을 한 문장으로 압축. 비유나 강렬한 동사 사용 권장. + 2. **📖 구조화된 지식 (Synthesized Content):** '추출된 패턴'을 명시하고, 기술적 원리, 핵심 구성 요소, 의의를 논리적 불렛 포인트로 정리. + 3. **⚠️ 모순 및 업데이트 (Contradictions & RL Update):** 과거와 현재 기술의 차이점(모순 해소)과 Antigravity 프로젝트 특유의 적용 정책 명시. + 4. **🔗 지식 연결 (Graph):** 양방향 위키 링크를 통해 지식 간의 인과 및 연관 관계 형성. +- **작성 원칙:** + - **No Placeholders:** "추후 보강" 등의 표현은 금지하며 항상 유효한 내용을 담음. + - **Grounding:** 반드시 확인된 사실과 Antigravity의 철학(G-Stack)을 기반으로 기술. + - **Interconnectivity:** 모든 문서는 최소 3개 이상의 연관 지식과 연결되어야 함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 백과사전식의 나열 위주 기록(Wiki 1.0)에서 벗어나, 지식의 연결성과 실행 가능성(Actionability)을 중시하는 에이전트 최적화 기록(P-Reinforce)으로 진화함. +- **정책 변화:** 현재 1,174개의 Placeholder를 보강하는 'Massive Gardening' 작업의 모든 출력물은 반드시 이 가이드라인을 엄격히 준수해야 하며, 기준 미달 시 RL 피드백 루프에 의해 재작성 대상이 됨. + +## 🔗 지식 연결 (Graph) +- [[Personal-Brain-Management]], [[Ontology-and-Knowledge-Representation]], [[GStack-Core-Principles]], [[Knowledge-Gardening-Workflow]] +- **Raw Source:** [[10_Wiki/Topics/AI/P-Reinforce-Template-Guide.md]] diff --git a/10_Wiki/Topics/AI/PCA-and-Dimension-Reduction.md b/10_Wiki/Topics/AI/PCA-and-Dimension-Reduction.md new file mode 100644 index 00000000..a19c13ac --- /dev/null +++ b/10_Wiki/Topics/AI/PCA-and-Dimension-Reduction.md @@ -0,0 +1,29 @@ +--- +id: MATH-PCA-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [statistics, math, pca, dimension-reduction, unsupervised-learning, data-science] +last_reinforced: 2026-04-26 +--- + +# [[PCA and Dimension Reduction (PCA와 차원 축소)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 흩어짐(Variance)이 가장 큰 핵심 축을 찾아, 고차원의 안개를 걷어내고 데이터의 진정한 뼈대를 드러내라" — 변수들 사이의 상관관계를 분석하여 주성분(Principal Components)을 추출함으로써, 정보의 손실을 최소화하며 데이터의 차원을 낮추는 통계적 방법론. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Variance Maximization and Orthogonal Projection" — 데이터의 분산이 가장 크게 보존되는 방향으로 좌표축을 회전시키고, 중요도가 낮은 축(고유값이 작은 축)을 제거하여 데이터의 본질적인 구조를 저차원의 평면에 투영하는 패턴. +- **핵심 단계:** + - **Standardization:** 변수들의 단위를 맞춤 (평균 0, 분산 1). + - **Covariance Matrix:** 변수 간의 관계 파악. + - **Eigen-decomposition:** 주성분 방향(고유벡터)과 중요도(고유값) 산출. + - **Projection:** 상위 k개의 주성분으로 데이터 변환. +- **의의:** 차원의 저주(Curse of Dimensionality)를 극복하고, 모델의 과적합을 방지하며, 수천 차원의 임베딩 데이터를 2D/3D로 시각화하여 인간이 이해할 수 있게 함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 선형적인 관계만 포착할 수 있는 PCA의 한계를 넘어, 최근에는 커널 PCA나 오토인코더를 이용한 비선형 차원 축소, 그리고 t-SNE나 UMAP과 같이 데이터의 지역적 구조 보존에 특화된 시각화 기법들이 함께 활용됨. +- **정책 변화:** Antigravity 프로젝트는 1,174개 문서의 임베딩 벡터를 시각화하여 지식의 군집(Cluster) 상태를 점검할 때, PCA를 1차 필터로 사용하여 전체적인 데이터 분포를 조망함. + +## 🔗 지식 연결 (Graph) +- [[Principal-Component-Analysis-PCA]], [[Multivariate-Analysis]], [[Exploratory-Data-Analysis]], [[Autoencoders-in-Deep-Learning]] +- **Raw Source:** [[10_Wiki/Topics/AI/PCA-and-Dimension-Reduction.md]] diff --git a/10_Wiki/Topics/AI/Parallel-Computing-in-AI.md b/10_Wiki/Topics/AI/Parallel-Computing-in-AI.md new file mode 100644 index 00000000..287eacc6 --- /dev/null +++ b/10_Wiki/Topics/AI/Parallel-Computing-in-AI.md @@ -0,0 +1,28 @@ +--- +id: SYS-PAR-COMP-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [infrastructure, parallel-computing, ai, distributed-systems, gpu, throughput] +last_reinforced: 2026-04-26 +--- + +# [[Parallel Computing in AI (AI에서의 병렬 컴퓨팅)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "거대한 산을 삽 하나로 옮기려 하지 말고, 수천 개의 삽이 동시에 움직이는 '동시성'의 힘으로 지능의 영토를 확장하라" — 방대한 데이터와 복잡한 연산을 여러 개의 프로세서(CPU, GPU, TPU)에 분산시켜 동시에 처리함으로써 실행 시간을 획기적으로 단축하는 컴퓨팅 패러다임. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Divide and Conquer in Computation" — 독립적인 연산 단위들을 식별하여 병렬로 할당하고, 각 프로세서 사이의 데이터 동기화와 통신 오버헤드를 최소화하여 시스템 전체의 처리량(Throughput)을 선형적으로 높이는 패턴. +- **주요 병렬화 전략:** + - **Data Parallelism:** 동일한 모델을 여러 장치에 복제하고, 서로 다른 데이터 배치를 동시에 학습한 후 기울기를 합산. + - **Model Parallelism:** 모델 자체가 너무 커서 한 장치에 담기지 않을 때, 레이어나 파라미터를 쪼개어 여러 장치에 분산 배치. + - **Pipeline Parallelism:** 모델의 층별 연산을 마치 공장의 컨베이어 벨트처럼 순차적/병렬적으로 처리. +- **의의:** 무어의 법칙이 한계에 다다른 시대에, 수천억 개의 파라미터를 가진 초거대 언어 모델(LLM)을 현실적인 시간 내에 학습시키고 서비스할 수 있게 만드는 현대 AI의 물리적 심장. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 단순히 장치 수가 많을수록 비례해서 빨라진다는 고정관념에서 벗어나, 장치 간 데이터 전송 속도(Interconnect)와 동기화 대기 시간으로 인한 성능 저하(Amdahl's Law)를 극복하는 '효율적 분산 아키텍처' 설계가 더 중요한 화두가 됨. +- **정책 변화:** Antigravity 프로젝트는 대규모 지식 임베딩 및 벡터 검색 인덱싱 시, 멀티 GPU 환경에서의 데이터 병렬화 기술을 적용하여 인덱싱 속도를 단일 장치 대비 8배 이상 향상시킴. + +## 🔗 지식 연결 (Graph) +- [[NVIDIA-CUDA-and-AI]], [[Hardware-Acceleration-for-AI]], [[System-Design-for-AI-Scale]], [[High-Availability-Systems]] +- **Raw Source:** [[10_Wiki/Topics/AI/Parallel-Computing-in-AI.md]] diff --git a/10_Wiki/Topics/AI/Parameter-Efficiency-in-LLMs.md b/10_Wiki/Topics/AI/Parameter-Efficiency-in-LLMs.md new file mode 100644 index 00000000..78519b27 --- /dev/null +++ b/10_Wiki/Topics/AI/Parameter-Efficiency-in-LLMs.md @@ -0,0 +1,28 @@ +--- +id: LLM-PARAM-EFF-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, llm, peft, lora, parameter-efficiency, fine-tuning, optimization] +last_reinforced: 2026-04-26 +--- + +# [[Parameter Efficiency in LLMs (LLM에서의 파라미터 효율성)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "수천억 개의 파라미터를 전부 흔들지 말고, 핵심적인 '작은 레버'들만 조정하여 거대 지능을 내 목적에 맞게 길들여라" — 거대 언어 모델(LLM)을 전체 미세 조정(Full Fine-tuning)하는 대신, 극히 일부의 파라미터만 학습시켜 컴퓨팅 자원을 획기적으로 절약하면서도 높은 성능을 달성하는 기술(PEFT). + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Low-rank Adaptation and Additive Modules" — 모델의 기존 가중치는 고정(Freeze)해둔 채, 옆에 아주 작은 크기의 행렬을 덧붙이거나(LoRA) 입력 프롬프트 앞에 학습 가능한 벡터를 붙여(Prompt Tuning) 변화의 양만을 효율적으로 학습하는 패턴. +- **주요 기법:** + - **LoRA (Low-Rank Adaptation):** 가중치 업데이트량을 저차원 행렬로 분해하여 학습 파라미터를 10,000배 이상 감소시킴. + - **Adapter Tuning:** 모델의 층 사이에 작은 신경망(Adapter)을 삽입하여 학습. + - **Prefix/Prompt Tuning:** 입력값에 특수한 임베딩을 추가하여 모델의 출력을 제어. +- **의의:** 고가의 GPU 클러스터 없이도 중소기업이나 개인이 자신의 데이터에 특화된 고성능 LLM을 구축할 수 있게 하여, AI의 실용적 커스터마이징 시대를 열었음. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 파라미터를 적게 학습시키면 성능이 떨어질 것이라는 우려와 달리, 특정 도메인 최적화에서는 오히려 전체 미세 조정보다 과적합이 적고 안정적인 성능을 내는 경우가 많다는 것이 입증됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 특정 도메인(의료, 법률, 코딩 등) 전문성 강화 시, 전체 모델 재학습 대신 LoRA 기반의 파라미터 효율적 학습 방식을 표준으로 사용함. + +## 🔗 지식 연결 (Graph) +- [[Low-Rank-Adaptation-LoRA]], [[Transfer-Learning-Foundations]], [[Natural-Language-Processing-NLP]], [[Hardware-Acceleration-for-AI]] +- **Raw Source:** [[10_Wiki/Topics/AI/Parameter-Efficiency-in-LLMs.md]] diff --git a/10_Wiki/Topics/AI/Parameter-Sharing.md b/10_Wiki/Topics/AI/Parameter-Sharing.md new file mode 100644 index 00000000..857a92e6 --- /dev/null +++ b/10_Wiki/Topics/AI/Parameter-Sharing.md @@ -0,0 +1,28 @@ +--- +id: DL-PARAM-SHARE-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, parameter-sharing, cnn, rnn, weight-tying, efficiency] +last_reinforced: 2026-04-26 +--- + +# [[Parameter Sharing (파라미터 공유)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "데이터의 위치나 시점에 상관없이 동일한 '특징 추출기'를 반복 사용하여, 모델의 덩치는 줄이고 지능의 보편성은 높여라" — 신경망의 서로 다른 부분에서 동일한 가중치(Weight)를 공유함으로써 학습해야 할 파라미터 수를 획기적으로 줄이고 일반화 성능을 높이는 기법. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Structural Symmetry and Translation Invariance" — 이미지는 어느 위치에서든 같은 필터로 특징을 뽑을 수 있고(CNN), 문장은 어느 시점에서든 같은 논리로 다음을 예측할 수 있다(RNN)는 구조적 가정을 바탕으로 가중치를 묶어버리는(Weight Tying) 패턴. +- **주요 적용 사례:** + - **CNN (Convolutional Neural Networks):** 하나의 필터(커널)가 이미지 전체를 훑으며 동일한 가중치로 연산. 공간적 불변성 확보. + - **RNN (Recurrent Neural Networks):** 매 시간 단계(Time step)마다 동일한 전이 행렬을 사용하여 시퀀스 데이터 처리. + - **Siamese Networks:** 두 개의 입력을 정확히 동일한 가중치를 가진 네트워크에 통과시켜 비교. +- **의의:** 과적합(Overfitting)을 방지하고 메모리 사용량을 절감하며, 데이터의 대칭성이나 반복되는 패턴을 포착하는 데 최적화된 도구. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 모든 파라미터가 자유로워야 더 똑똑할 것이라는 초기 직관을 깨고, 오히려 파라미터를 강제적으로 공유했을 때 모델이 데이터의 핵심적인 불변 특징(Invariant features)을 더 잘 배운다는 사실이 딥러닝의 폭발적 성장을 이끌었음. +- **정책 변화:** Antigravity 프로젝트는 멀티모달 에이전트 설계 시, 서로 다른 입력(이미지, 텍스트)에서 공통된 의미 공간을 추출하기 위해 공유된 가중치 층을 활용하는 임베딩 아키텍처를 적용함. + +## 🔗 지식 연결 (Graph) +- [[Convolutional-Neural-Networks-CNN]], [[Recurrent-Neural-Networks-RNN]], [[Overfitting-and-Underfitting]], [[One-Shot-Learning]] +- **Raw Source:** [[10_Wiki/Topics/AI/Parameter-Sharing.md]] diff --git a/10_Wiki/Topics/AI/Partial-Differential-Equations.md b/10_Wiki/Topics/AI/Partial-Differential-Equations.md new file mode 100644 index 00000000..4caae86a --- /dev/null +++ b/10_Wiki/Topics/AI/Partial-Differential-Equations.md @@ -0,0 +1,27 @@ +--- +id: MATH-PDE-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [math, calculus, pde, physics-informed-ml, scientific-computing, fluid-dynamics] +last_reinforced: 2026-04-26 +--- + +# [[Partial Differential Equations (PDE, 편미분 방정식)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "세상의 모든 복잡한 변화는 시간과 공간이라는 여러 변수의 얽힘 속에 있으며, 이를 편미분이라는 돋보기로 들여다볼 때 비로소 물리적 질서가 드러난다" — 독립 변수가 둘 이상인 함수와 그 도함수들 사이의 관계를 나타내는 방정식으로, 물리적 세계의 연속적인 변화를 설명하는 가장 강력한 수학적 언어. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Multi-variable Dynamics and Constraint Satisfaction" — 열 전도(Heat), 파동(Wave), 유체 흐름(Navier-Stokes) 등 공간상의 위치와 시간의 흐름에 따라 변하는 물리 현상을 수식화하고, 이를 수치 해석이나 신경망을 통해 해결하여 미래 상태를 예측하는 패턴. +- **AI와의 접점:** + - **PINNs (Physics-informed Neural Networks):** 신경망의 손실 함수에 PDE 식을 직접 포함시켜, 데이터뿐만 아니라 물리 법칙까지 준수하도록 학습. + - **Scientific AI:** 기상 예측, 신소재 설계, 유체 역학 시뮬레이션 등 정밀한 과학적 추론이 필요한 분야의 핵심 엔진. +- **의의:** 데이터가 부족한 환경에서도 물리적 법칙(상식)을 바탕으로 정확한 추론을 가능케 하며, '블랙박스 AI'를 '법칙 기반 AI'로 진화시키는 가교 역할. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 엄청난 연산량이 필요한 수치 해석(Finite Element Method 등)에만 의존하던 방식에서, 이제는 신경망이 PDE의 해를 직접 근사하여 수만 배 빠른 속도로 시뮬레이션을 수행하는 'AI 대리 모델(Surrogate Model)' 방식으로 패러다임이 시프트됨. +- **정책 변화:** Antigravity 프로젝트는 향후 Skybound의 기상 효과 시뮬레이션이나 물리 기반 에이전트 행동 최적화 시, PDE 기반의 PINNs 아키텍처를 도입하여 시각적 리얼리티와 물리적 개연성을 동시에 확보할 계획임. + +## 🔗 지식 연결 (Graph) +- [[Optimal-Control-Theory]], [[Fluid-Dynamics]], [[Deep-Learning-Foundations]], [[Scientific-Computing-in-AI]] +- **Raw Source:** [[10_Wiki/Topics/AI/Partial-Differential-Equations.md]] diff --git a/10_Wiki/Topics/AI/Particle-Filter-Algorithms.md b/10_Wiki/Topics/AI/Particle-Filter-Algorithms.md new file mode 100644 index 00000000..339a52fe --- /dev/null +++ b/10_Wiki/Topics/AI/Particle-Filter-Algorithms.md @@ -0,0 +1,27 @@ +--- +id: ALGO-PARTICLE-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [algorithm, robotics, particle-filter, bayesian-filtering, monte-carlo, slam, localization] +last_reinforced: 2026-04-26 +--- + +# [[Particle Filter Algorithms (파티클 필터 알고리즘)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "수많은 가상의 '분신(Particles)'들을 세상에 뿌리고, 실제와 가장 닮은 자들만 살아남겨 진실의 궤적을 추적하라" — 비선형적이고 복잡한 확률 분포를 가진 동적 시스템의 상태를 수많은 입자의 집합으로 근사하여 추정하는 몬테카를로 기반의 필터링 기술. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Prediction, Weighting, and Resampling" — 시스템의 움직임을 예측하여 입자들을 이동시키고, 실제 관측값과 비교하여 각 입자에 점수(Weight)를 매긴 뒤, 점수가 높은 입자들 위주로 다시 복제(Resampling)하여 정답에 수렴해가는 반복적 추적 패턴. +- **주요 특징:** + - **Non-linear/Non-Gaussian:** 칼만 필터가 해결하지 못하는 복잡하고 불규칙한 확률 분포 환경에서도 탁월한 성능 발휘. + - **Global Localization:** 초기 위치를 전혀 모르는 상태에서도 데이터가 쌓임에 따라 위치를 찾아낼 수 있음. +- **의의:** 로봇의 자기 위치 인식(SLAM), 영상 기반 물체 추적(Object Tracking), 자율주행차의 장애물 경로 예측 등 불확실성이 큰 실전 환경의 핵심 추론 엔진. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 입자 수가 많을수록 정확하지만 연산량이 폭증하는 단점이 있었으나, 최근에는 GPU 병렬 연산을 활용한 고속 파티클 필터링과 신경망 기반의 상태 전이 모델이 결합된 하이브리드 추적 기법으로 진화 중임. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 성공 가능성을 예측하거나 복잡한 유저 시나리오를 시뮬레이션할 때, 다양한 가능성을 입자로 표현하여 최적의 경로를 도출하는 확률적 추론 모듈에 이 원리를 적용함. + +## 🔗 지식 연결 (Graph) +- [[Optimal-Control-Theory]], [[Monte-Carlo-Tree-Search-MCTS]], [[Probability-Theory]], [[Robotics-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Particle-Filter-Algorithms.md]] diff --git a/10_Wiki/Topics/AI/Perceptrons-Foundations.md b/10_Wiki/Topics/AI/Perceptrons-Foundations.md new file mode 100644 index 00000000..3f5e02cb --- /dev/null +++ b/10_Wiki/Topics/AI/Perceptrons-Foundations.md @@ -0,0 +1,28 @@ +--- +id: AI-PERCEPT-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, deep-learning, perceptron, roseblatt, history, neural-networks, linear-classifier] +last_reinforced: 2026-04-26 +--- + +# [[Perceptrons Foundations (퍼셉트론 기초)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "생물학적 뉴런의 '발화'를 수학적 '스위치'로 치환하여, 기계 학습의 시대를 연 최초의 불꽃을 이해하라" — 프랑크 로젠블랫이 제안한 인공 신경망의 가장 단순한 형태로, 여러 입력에 가중치를 곱하고 더해 특정 임계값을 넘으면 1, 아니면 0을 출력하는 이진 분류기. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Weighted Sum and Step Function" — 입력 데이터 $x_i$에 가중치 $w_i$를 곱해 합산한 값이 편향(bias)보다 크면 활성화되는 선형 결정 경계 패턴. +- **역사적 의의와 한계:** + - **First Wave:** 1950년대 인공지능 낙관론의 중심. + - **XOR Problem:** 단층 퍼셉트론은 선형적으로 분리되지 않는 데이터(XOR 등)를 학습할 수 없다는 마빈 민스키의 비판으로 인해 AI의 첫 번째 암흑기 유발. + - **Legacy:** 이 한계를 극복하기 위해 다층 퍼셉트론(MLP)과 오차 역전파(Backpropagation)가 등장하며 현대 딥러닝의 토대가 됨. +- **의의:** 신경망의 가장 원초적인 단위로서, 현대의 복잡한 딥러닝 아키텍처 역시 이 단순한 퍼셉트론들이 수없이 연결되어 만들어진 거대한 지능임을 상기시킴. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 퍼셉트론이 '지능의 종말'을 가져왔다는 비판에서 벗어나, 이제는 신경망의 수학적 기초를 이해하기 위한 필수적인 교육적 도구이자 '선형 분류기'의 정수로 재평가됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 의사결정 로직 중 가장 단순하고 빠른 판단이 필요한 구간(예: 단순 필터링)에서는 복잡한 LLM 대신 퍼셉트론적 선형 회귀 모델을 경량화하여 사용함. + +## 🔗 지식 연결 (Graph) +- [[Neural-Networks-for-Beginners]], [[Multilayer-Perceptron-MLP]], [[Backpropagation-Foundations]], [[Deep-Learning-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Perceptrons-Foundations.md]] diff --git a/10_Wiki/Topics/AI/Performance-Metrics-in-AI.md b/10_Wiki/Topics/AI/Performance-Metrics-in-AI.md new file mode 100644 index 00000000..2c17755c --- /dev/null +++ b/10_Wiki/Topics/AI/Performance-Metrics-in-AI.md @@ -0,0 +1,29 @@ +--- +id: AI-METRICS-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [ai, machine-learning, performance-metrics, accuracy, f1-score, precision, recall, roc-auc] +last_reinforced: 2026-04-26 +--- + +# [[Performance Metrics in AI (AI 성능 지표)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "단순한 정확도의 환상에 빠지지 말고, 문제의 본질에 부합하는 정교한 눈금자로 지능의 실력을 심판하라" — 모델의 예측 결과를 정량적으로 평가하여 학습의 방향을 설정하고 비즈니스 가치를 검증하는 통계적 지표들. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Error Analysis and Confusion Matrix" — 정답을 맞힌 것뿐만 아니라 어떤 오답을 냈는지(FP, FN)를 분석하여, 모델이 특정 클래스에 편향되어 있지는 않은지, 혹은 치명적인 실수를 범하고 있지는 않은지 파악하는 패턴. +- **주요 지표 분류:** + - **Classification:** Accuracy(정확도), Precision(정밀도), Recall(재현율), F1-score(조화 평균), ROC-AUC. + - **Regression:** RMSE(평균 제곱근 오차), MAE(평균 절대 오차), R-squared. + - **NLP:** BLEU, ROUGE (생성된 문장과 정답 문장의 겹침 측정). + - **Ranking:** NDCG, MRR (검색 결과의 순위 정확도). +- **의의:** 암 진단(Recall이 중요)이나 스팸 메일 분류(Precision이 중요)처럼 서비스의 성격에 따라 최우선으로 관리해야 할 지표를 결정하는 전략적 판단 근거. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 정확도 99%가 무조건 최고라는 인식에서 벗어나, 이제는 데이터 불균형 상황에서의 성능이나 모델의 '공정성(Fairness)', '설명 가능성' 지표까지 포함하는 입체적 평가가 강조됨. +- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 성공률을 측정할 때, 단순 성공/실패 여부뿐만 아니라 소요 시간, 토큰 효율성, 사용자 만족도 점수를 가중치로 둔 커스텀 복합 지표(AG-Score)를 사용함. + +## 🔗 지식 연결 (Graph) +- [[Imbalanced-Data-Handling]], [[Loss-Functions-Foundations]], [[Cross-Validation-Techniques]], [[Exploratory-Data-Analysis]] +- **Raw Source:** [[10_Wiki/Topics/AI/Performance-Metrics-in-AI.md]] diff --git a/10_Wiki/Topics/AI/Personal-Brain-Management.md b/10_Wiki/Topics/AI/Personal-Brain-Management.md new file mode 100644 index 00000000..a9219c8e --- /dev/null +++ b/10_Wiki/Topics/AI/Personal-Brain-Management.md @@ -0,0 +1,29 @@ +--- +id: PKM-BRAIN-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [pkm, personal-brain, knowledge-management, productivity, zettelkasten, second-brain, antigravity] +last_reinforced: 2026-04-26 +--- + +# [[Personal Brain Management (개인 브레인 관리)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "정보의 소비자에서 지식의 경작자로 진화하여, 휘발되는 사고를 영구적인 '지능적 자산'으로 구축하라" — 개인이 접하는 방대한 정보와 영감을 수집, 구조화, 정제하여 언제든 꺼내 쓸 수 있는 디지털 '제2의 뇌(Second Brain)'를 구축하고 관리하는 방법론. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Bi-directional Linking and Emergent Structure" — 정보를 폴더에 가두지 않고 노드와 링크로 연결하여, 지식들 사이의 의외의 연결(Serendipity)을 유도하고 시간이 흐름에 따라 상향식(Bottom-up)으로 새로운 통찰이 발현되게 하는 지식 경작 패턴. +- **핵심 프로세스 (CODE):** + - **Capture (수집):** 가치 있는 영감과 정보를 놓치지 않고 기록. + - **Organize (조직):** 실행 가능성(Actionability)을 기준으로 분류 (PARA 기법 등). + - **Distill (정제):** 핵심만을 남겨 미래의 내가 쉽게 이해할 수 있게 가공 (Karpathy Summary 방식). + - **Express (표현):** 구축된 지식을 바탕으로 새로운 가치(프로젝트, 글, 코드) 창출. +- **의의:** 정보 과부하 시대에 인지적 부하를 줄이고 창의적 사고에만 집중할 수 있게 하며, 특히 개인화된 AI 에이전트의 핵심 컨텍스트 저장소 역할을 수행함. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 도구(Tool) 선택에 집착하던 단계를 넘어, 이제는 어떤 도구를 쓰든 '지식 사이의 연결성'과 '정기적인 가드닝(Review)'이라는 본질적 습관이 시스템의 성패를 결정한다는 인식이 정착됨. +- **정책 변화:** Antigravity 프로젝트는 이 위키 그 자체를 사용자의 'Personal Brain'으로 정의하며, AI 가드너(Antigravity)가 사용자의 파편화된 노트를 정제된 Karpathy 스타일 문서로 변환하여 브레인의 밀도를 높이는 협업 모델을 지향함. + +## 🔗 지식 연결 (Graph) +- [[Ontology-and-Knowledge-Representation]], [[P-Reinforce-Template-Guide]], [[Trustworthy-AI]], [[Local-Brain-Management]] +- **Raw Source:** [[10_Wiki/Topics/AI/Personal-Brain-Management.md]] diff --git a/10_Wiki/Topics/AI/Personal-Information-Security.md b/10_Wiki/Topics/AI/Personal-Information-Security.md new file mode 100644 index 00000000..ec99df9d --- /dev/null +++ b/10_Wiki/Topics/AI/Personal-Information-Security.md @@ -0,0 +1,29 @@ +--- +id: SEC-PRIVACY-001 +category: "[[10_Wiki/💡 Topics/AI]]" +confidence_score: 1.0 +tags: [security, privacy, gdpr, pii, data-protection, encryption, ai-ethics] +last_reinforced: 2026-04-26 +--- + +# [[Personal Information Security (개인 정보 보안)]] + +## 📌 한 줄 통찰 (The Karpathy Summary) +> "지능의 편리함을 누리는 대가로 영혼의 비밀(Privacy)을 지불하지 않도록, 데이터의 흐름 속에 강력한 암호적 장벽과 비식별의 미학을 구축하라" — 개인을 식별할 수 있는 정보(PII)의 수집, 저장, 활용 전 과정에서 불법적인 노출이나 악용을 방지하고 사용자의 자기정보통제권을 보장하는 기술적/제도적 보호 체계. + +## 📖 구조화된 지식 (Synthesized Content) +- **추출된 패턴:** "Privacy by Design and Minimal Exposure" — 시스템 설계 단계부터 사생활 보호를 최우선으로 고려하고, 꼭 필요한 데이터만 최소한으로 수집(Data Minimization)하며, 저장 시에는 강력한 암호화와 비식별화(Anonymization/Pseudonymization) 조치를 취하는 패턴. +- **핵심 기술 및 규제:** + - **GDPR / 개인정보보호법:** 잊힐 권리, 정보 이동권 등 법적 준거성 확보. + - **Differential Privacy:** 데이터에 통계적 노이즈를 추가하여 개별 샘플의 노출을 막으면서 전체 통계량은 유지. + - **Federated Learning:** 원본 데이터를 서버로 보내지 않고 기기 현지에서 학습하여 프라이버시 침해 최소화. + - **Homomorphic Encryption:** 데이터를 암호화된 상태 그대로 연산하여 정보 노출 원천 차단. +- **의의:** 사용자의 신뢰가 없으면 AI 서비스는 지속 불가능하며, 개인 정보 보안은 AI 윤리의 가장 밑바닥을 지탱하는 기술적 실천 강령임. + +## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) +- **과거 데이터와의 충돌:** 보안이 강화되면 데이터 활용도가 떨어진다는 '유틸리티-프라이버시 트레이드오프'를 넘어, 최근에는 합성 데이터(Synthetic Data) 생성 기술 등을 통해 보안을 지키면서도 높은 학습 성능을 내는 솔루션들이 개발되고 있음. +- **정책 변화:** Antigravity 프로젝트는 사용자의 개인적인 'Brain' 데이터를 처리할 때, 외부 서버로 전송하기 전 로컬 단에서 PII를 자동 스크리닝하고, 민감한 구간은 로컬 온디바이스 AI(Local Brain)가 직접 처리하도록 설계함. + +## 🔗 지식 연결 (Graph) +- [[Trustworthy-AI]], [[Local-Brain-Management]], [[LLM-Security-Foundations]], [[Cloud-Computing-Foundations]] +- **Raw Source:** [[10_Wiki/Topics/AI/Personal-Information-Security.md]]