feat: Knowledge Gardening Milestone 440 (Batch #22)

This commit is contained in:
Antigravity Agent
2026-04-26 20:09:10 +09:00
parent 35d868b28d
commit 25d5862dcb
24 changed files with 732 additions and 12 deletions
@@ -0,0 +1,101 @@
# Skybound Hangar Unified Button Legibility System
작성일: 2026-04-26 17:38 KST
## 요청 요약
- Permanent Upgrade 화면의 `UPGRADE` 버튼 글씨가 잘 보이지 않는다.
- 이 화면만 고치는 것이 아니라, 전체적으로 비슷한 사례가 있는지 확인하고 같은 패턴을 사용하도록 정리해야 한다.
## 핵심 문제
행거 UI 안에서 버튼 스타일이 여러 계열로 나뉘어 있었다.
확인된 버튼 계열:
- `upgrade-btn`
- `craft-btn`
- `coupon-btn`
- `support-btn`
- `pass-buy-btn`
- `cache-confirm-btn`
- `unequip-btn`
- settings action/toggle 버튼
특히 비활성 상태가 각각 다른 방식으로 표현되고 있었고, 일부는 배경과 글자 대비가 낮아 “비활성”이 아니라 “읽기 어려움”으로 느껴졌다.
## 적용한 해결 방향
행거 내부 버튼에 공통 버튼 대비 시스템을 추가했다.
원칙:
- 활성 버튼은 행동 가능한 CTA로 명확하게 보여야 한다.
- 비활성 버튼도 읽을 수 있어야 한다.
- 비활성은 낮은 채도/낮은 강조도로 표현하되, 글자 대비는 유지한다.
- 위험/해제 버튼은 빨강 계열, 일반 실행 버튼은 cyan/lime 계열, premium/cosmic 계열은 gold 계열로 통일한다.
## 적용한 변경
### 공통 버튼 베이스 추가
대상:
- `craft-btn`
- `upgrade-btn`
- `coupon-btn`
- `pass-buy-btn`
- `support-btn`
- `cache-confirm-btn`
- `unequip-btn`
- `settings-toggle`
- `settings-action`
변경:
- 공통 font smoothing 적용
- 공통 border radius, border, shadow, weight 적용
- 버튼 텍스트를 uppercase + 굵은 weight로 통일
- 기본 액션 버튼은 cyan/lime 계열로 통일
### 비활성 버튼 대비 개선
변경:
- 비활성 버튼 글자색을 더 밝은 blue-white 계열로 변경
- 어두운 네이비 배경 위에서도 읽히도록 text-shadow 적용
- opacity를 과도하게 낮추지 않음
- cursor는 `not-allowed`로 유지
의도:
- `UPGRADE` 같은 문구가 흐릿해서 안 보이는 문제를 해결한다.
- 사용자는 버튼이 비활성이라는 사실과 버튼의 기능을 동시에 인지할 수 있다.
### 행동 종류별 색상 통일
변경:
- 일반 실행/확인: cyan/lime
- 위험/해제/무음 OFF: pink/red
- cosmic/forge/premium/max: gold/orange
의도:
- 버튼마다 다른 디자인 언어를 쓰지 않고, 행동의 성격에 따라 같은 색상 규칙을 공유한다.
## 수정 파일
- `/Volumes/Data/project/Antigravity/Skybound/src/features/game/ui/HangarOverlay.css`
## 검증
- `npm run build` 성공
- 출력 디렉터리: `dist/44`
## 후속 체크 포인트
- Permanent Upgrade 화면에서 비활성 `UPGRADE` 텍스트가 읽히는지 확인한다.
- Craft/Synthesis/Salvage/Forge/Pass 버튼의 활성/비활성 상태가 같은 규칙으로 보이는지 확인한다.
- 위험 버튼과 일반 실행 버튼이 명확히 구분되는지 확인한다.
- 버튼이 너무 강하게 보여서 비활성 상태가 활성처럼 오해되지 않는지 확인한다.
+31
View File
@@ -0,0 +1,31 @@
# [[Frontend Folder Structure]]
## 📌 Brief Summary
프론트엔드 폴더 구조(Frontend Folder Structure)는 리액트(React)를 비롯한 애플리케이션의 유지보수성, 확장성, 협업 효율성을 결정짓는 핵심 아키텍처 요소입니다 [1-3]. 과거의 파일 유형(File-Type) 중심의 구조에서 벗어나 비즈니스 기능(Feature) 및 도메인을 중심으로 모듈화하는 방식이 권장됩니다 [4, 5]. 이를 통해 코드 결합도를 낮추고 응집도를 높여 복잡한 시스템에서도 예측 가능성을 유지하고 기술 부채를 방지할 수 있습니다 [5-7].
## 📖 Core Content
- **폴더 구조의 중요성**: 체계적이지 않은 구조는 코드를 얽히게 만들고 디버깅과 테스트를 어렵게 하여 결과적으로 기술 부채를 유발합니다 [1, 8, 9]. 반면 잘 설계된 프로젝트는 UI 요소, 비즈니스 로직, 상태 관리를 명확하게 분리(Separation of Concerns)하여 모듈의 재사용성과 협업 효율성을 크게 높여줍니다 [3, 9].
- **기존 폴더 구조 접근법과 한계**:
- **단일(Flat) 구조**: 소규모 애플리케이션에 적합하게 모든 파일을 루트 레벨 근처에 배치하는 방식으로, 프로젝트가 커지면 관리와 확장이 불가능에 가깝습니다 [10].
- **파일 유형 기반(File-Type Based)**: `components`, `hooks`, `services` 등 기술적 역할에 따라 폴더를 나누는 전통적 방식입니다(예: MVC 패턴). 기능이 복잡해질수록 하나의 기능을 수정하기 위해 여러 폴더를 넘나들어야 하므로 확장성이 현저히 떨어집니다 [4, 11, 12].
- **기능 기반 구조(Feature-Based Structure)**: 2025년 기준 모던 프론트엔드 개발에서는 비즈니스 기능을 중심으로 폴더를 분리하는 방식이 권장됩니다 [5]. 예를 들어 `src/features/auth` 폴더 내부에 인증과 관련된 컴포넌트, 훅(Hooks), API 통신 로직, 타입을 모두 캡슐화하여 독립적인 모듈로 관리합니다 [13, 14].
- **권장되는 하이브리드 디렉토리 구성** [5, 14-23]:
- `/assets`: 이미지, 폰트 등 정적 미디어 리소스.
- `/components`: 애플리케이션 전체에서 공유되는 재사용 가능한 UI 컴포넌트 (버튼, 모달 등).
- `/features`: 핵심 기능 및 도메인 로직이 응집된 독립 모듈.
- `/hooks``/utils`: 전역적으로 공유되는 커스텀 훅과 범용 유틸리티 함수.
- `/services` (또는 `/api`): 외부 서버와의 통신 및 서드파티 서비스 연동 로직.
- `/store` (또는 `/context`): Redux, Zustand 등을 활용한 전역 상태 관리 인프라.
- `/pages``/layouts`: 라우팅에 매핑되는 페이지 화면 및 공통 레이아웃 컴포넌트.
- **FSD (Feature-Sliced Design) 방법론**: 기능 기반 설계를 한 단계 더 체계화한 아키텍처로, 프론트엔드 프로젝트를 `app`, `pages`, `widgets`, `features`, `entities`, `shared`라는 6가지 계층(Layer)으로 나눕니다 [24-26].
- 상위 계층이 하위 계층에만 의존해야 하는 '단방향 의존성' 규칙을 강제하여 순환 참조를 방지합니다 [24].
- 각 슬라이스(Slice)는 반드시 `index.ts`를 통해 정의된 퍼블릭 API(Public API)만 외부에 노출하여 내부 구현을 철저히 캡슐화하고 안전한 리팩토링을 보장합니다 [24, 27, 28].
- **네이밍 컨벤션과 거버넌스(Naming & Governance)**: 구조화와 더불어 일관된 네이밍 규칙은 필수입니다. 파일 및 폴더 이름에는 운영체제 간 호환성을 위해 `kebab-case`를 사용하거나 리액트 컴포넌트에 맞춰 `PascalCase`를 주로 사용하며, 변수나 함수, 훅은 `camelCase`를 준수해야 합니다 [29-34]. 또한 ESLint와 같은 도구를 사용해 이러한 아키텍처 및 네이밍 규칙 위반을 자동 검사(Linting)하도록 설정하는 것이 모범 사례입니다 [30].
## 🔗 Knowledge Connections
- **Related Topics:** [[Feature-Sliced Design (FSD)]], [[Clean Code Principles]], [[State Management]]
- **Projects/Contexts:** [[Scalable React Applications]], [[Next.js File Naming and Routing]]
- **Contradictions/Notes:** 컴포넌트, 훅, 서비스 등의 파일 유형에 따라 그룹화하는 방식(File-Type Based)은 직관적이라 초기 개발이나 초보자가 접근하기는 쉽지만, 애플리케이션의 규모가 확장되고 도메인 로직이 복잡해질 경우에는 기능(Feature) 기반 구조에 비해 유지보수성과 생산성이 크게 떨어지며 스파게티 코드를 유발하는 원인이 됩니다 [7, 11, 12].
---
*Last updated: 2026-04-26*
+26
View File
@@ -0,0 +1,26 @@
# [[Legacy React Code Refactoring]]
## 📌 Brief Summary
레거시 React 코드 리팩토링은 기존 코드의 동작 방식을 그대로 보존하면서 애플리케이션의 구조, 가독성, 유지보수성을 향상시키는 체계적인 과정입니다 [1]. 이는 단순히 코드를 고치는(fixing) 작업이 아니라 점진적인 구조 개선을 목표로 하며, 테스트 작성을 통해 시스템을 보호하는 것에서 시작합니다 [1, 2]. 주요 접근법으로는 클래스 기반 컴포넌트의 함수형 컴포넌트 전환, 커스텀 훅(Custom Hooks)을 통한 로직 분리, 상태 관리 도구의 현대화 등이 있습니다 [3, 4].
## 📖 Core Content
* **테스트 기반의 리팩토링 시작**
리팩토링을 수행할 때 가장 우선시해야 할 작업은 단위 테스트(Unit test)를 작성하는 것입니다 [2]. 테스트를 작성하면 코드를 변경하는 과정에서 기존 기능이 망가지는 것을 즉각적으로 파악할 수 있으며, 기존 앱이 어떻게 동작하는지 강제로 학습할 수 있는 이점도 있습니다 [2, 5]. TypeScript로의 전환이나 라이브러리 업그레이드 시 UI 테스트 스위트를 작성하여 회귀(Regression) 오류를 방지해야 합니다 [6].
* **구조 및 상태 관리 현대화**
* **점진적 마이그레이션:** 기존 기술(예: Context API)에서 새로운 도구(예: Zustand)로 전환할 때 한 번에 모든 것을 재작성(Rewrite)하는 것은 위험하므로, 알림 기능과 같은 단순한 유틸리티에서 시작해 점차 복잡한 영역으로 확장하는 점진적 접근이 필요합니다 [1].
* **클래스 컴포넌트 제거:** 기존 클래스 기반 컴포넌트들을 함수형 컴포넌트 및 훅(Hooks) 구조로 변경해야 합니다 [4].
* **상태 관리 도구 분리:** 불필요한 `useEffect` 사용을 제거하고, 서버 상태 관리에는 TanStack Query를 도입하여 기존의 복잡한 Redux 구현을 걷어낼 수 있습니다. 전역 클라이언트 상태는 Context나 Zustand로 관리하고, 로컬 상태는 해당 컴포넌트에만 국한하는 것이 좋습니다 [4].
* **커스텀 훅을 활용한 로직 분리 및 책임 분배**
오래된 코드베이스의 큰 문제 중 하나는 단일 컴포넌트 안에 다양한 책임이 혼재되어 있다는 점입니다 [7]. 현대 React 리팩토링의 핵심 단위는 '커스텀 훅(Custom Hooks)'입니다 [3]. 방대한 컴포넌트에서 데이터 패칭이나 폼 핸들링과 같은 비즈니스 로직을 커스텀 훅으로 추출하면, UI와 비즈니스 로직이 분리되어 독립적으로 더 빠른 단위 테스트를 수행할 수 있게 됩니다 [3].
* **클린 코드와 일관성 강제**
* **스타일링 표준화:** 인라인 스타일, 외부 CSS, sx 등 무분별하게 혼재된 CSS 적용 방식을 단일 표준(예: Plain CSS, CSS Modules 등)으로 통일해야 합니다 [8-10].
* **원칙 적용:** 'DRY(Don't Repeat Yourself)' 및 'YAGNI(You Aren't Gonna Need It)' 원칙을 바탕으로 코드를 개선하고, 변수 호이스팅과 돌연변이(Mutation)를 방지하며 명확한 변수명을 사용해야 합니다 [11].
* **거버넌스 도구 도입:** ESLint(특히 `eslint-plugin-react`, `eslint-plugin-react-hooks`)를 도입하여 개발 모범 사례를 강제함으로써 코드베이스 전체에 규칙을 일관되게 적용할 수 있습니다 [12].
## 🔗 Knowledge Connections
- **Related Topics:** [[Unit Testing]], [[Custom Hooks]], [[State Management Migration]], [[Clean Code Principles]]
- **Projects/Contexts:** [[Frontend System Architecture]], [[Legacy Code Modernization]]
- **Contradictions/Notes:** 일반적으로 전체를 한 번에 새로 짜는 것보다는 기존 기능 개발을 지속하면서 점진적으로 개선(Refactor)하는 것이 권장되지만 [1], 코드베이스의 규모가 매우 작을 경우에는 아예 처음부터 다시 작성하는 것이 더 쉬울 수도 있다는 의견도 존재합니다 [6].
---
*Last updated: 2026-04-26*
@@ -0,0 +1,23 @@
# [[Team Collaboration and Code Governance]]
## 📌 Brief Summary
팀 협업 및 코드 거버넌스(Team Collaboration and Code Governance)는 프론트엔드 개발팀이 일관성 있는 코드를 작성하고 충돌 없이 효율적으로 협업하기 위한 규칙과 자동화 도구의 활용을 의미합니다 [1, 2]. 주요 요소로는 일관된 파일 명명 규칙, ESLint와 Prettier 등을 활용한 자동화된 린팅, 그리고 티켓 ID와 Pull Request(PR) 리뷰를 포함하는 효율적인 Git 브랜칭 전략이 있습니다 [3-5]. 이러한 표준화된 구조와 거버넌스는 대규모 프로젝트에서 인지적 부하를 줄이고, 코드 품질을 유지하며, 팀이 안전하게 확장할 수 있는 필수적인 기반을 제공합니다 [6-8].
## 📖 Core Content
* **자동화된 코드 거버넌스와 린팅 (Automated Governance):** 현대의 프론트엔드 프로젝트에서는 코딩 표준을 수동으로 강제하는 대신 ESLint와 Prettier를 사용하여 위반 사항을 자동으로 감지하고 수정합니다 [3]. ESLint 규칙을 통해 특정 기능이 다른 기능으로부터 잘못된 임포트를 하는 것을 막아 아키텍처 경계를 강제할 수 있으며, Husky를 활용해 코드를 커밋하기 전에 린팅, 포맷팅, 타입 체킹을 실행하는 Git 훅(Git hooks)을 설정함으로써 고품질의 코드만 저장소에 병합되도록 보장합니다 [3, 9].
* **표준화된 명명 규칙 (Naming Conventions):** 일관된 명명 규칙은 협업 시 혼란을 줄이고 코드베이스 탐색을 돕습니다 [10]. 운영체제 간(Windows/macOS 대 Linux) 대소문자 구분 문제로 인한 CI/CD 파이프라인 빌드 실패를 방지하기 위해 파일 및 폴더 이름은 `kebab-case`를 사용하고, React 컴포넌트 이름은 `PascalCase`를 사용하는 것이 강력히 권장됩니다 [11-13]. 상수나 Enum은 `UPPER_SNAKE_CASE`를 사용합니다 [14].
* **소규모 팀을 위한 Git 브랜치 전략 (Git Workflow for Small Teams):** 2~5명의 소규모 팀에게는 무거운 Git Flow 대신 '보호된 main 브랜치가 있는 단순한 기능 브랜치 워크플로우(Feature-Branch Workflow)'가 가장 적합합니다 [15, 16].
* **브랜치 생성 및 명명:** 항상 안정적이고 배포 가능한 상태인 `main` 브랜치에서 분기하여 작업마다 수명이 짧은 기능 브랜치를 생성합니다 [17, 18]. 추적성을 높이기 위해 `feature/PROJ-123-user-auth`와 같이 작업 유형, 티켓 ID, 짧은 설명을 포함하는 명확한 브랜치 이름 규칙을 적용합니다 [19-21].
* **커밋 메시지 (Conventional Commits):** 코드는 의미 단위로 작게 자주 커밋해야 하며 [22, 23], `feat:`, `fix:`, `chore:`, `refactor:` 등의 접두사를 사용하는 관례적 커밋을 통해 변경 사항의 내용과 이유를 명확히 작성해야 합니다 [24, 25].
* **풀 리퀘스트(PR)와 코드 리뷰:** 변경 사항을 머지하기 위해서는 반드시 PR을 열고 최소 1명 이상의 팀원에게 리뷰를 받아야 하며, CI 테스트 통과를 필수로 요구합니다 [22, 23, 26, 27]. PR은 리뷰어가 빠르고 꼼꼼하게 검토할 수 있도록 작게 유지하는 것이 중요합니다 [24, 26].
* **병합 및 정리:** 머지 시에는 '스쿼시 머지(Squash Merge)'를 사용하여 main 브랜치의 히스토리를 깔끔하게 유지하고, 작업이 끝난 브랜치는 자동으로 삭제하도록 설정합니다 [23, 26, 28].
* **시각적 리뷰 (Visual Reviews):** Storybook과 Chromatic 같은 도구를 연동하여 UI 변경 사항을 자동으로 캡처하고 베이스라인과 비교함으로써, 의도치 않은 UI 회귀(Regression)가 운영 환경에 배포되는 것을 방지하는 시각적 PR 리뷰 프로세스를 구축하는 것이 권장됩니다 [29-31].
* **폴더 구조를 통한 협업 향상:** 팀의 모든 개발자가 기능 기반(Feature-based)과 같은 표준화된 폴더 구조를 따르면, 커뮤니케이션 비용이 감소하고 신규 개발자의 온보딩이 매우 빨라집니다 [8]. 또한 파일 작업 시 파일들이 분리되어 있어 개발자 간의 충돌을 최소화할 수 있습니다 [8].
## 🔗 Knowledge Connections
- **Related Topics:** [[Frontend Folder Structure]], [[Git Branching Strategies]], [[Clean Code Principles]], [[Feature-Sliced Design]]
- **Projects/Contexts:** [[React Project Setup]], [[Small Team Workflow]], [[Continuous Integration/Continuous Deployment (CI/CD)]]
- **Contradictions/Notes:** 소규모 팀(2~5명)의 경우 무거운 'Git Flow' 전략은 오버헤드가 커서 권장되지 않으며, 트렁크 기반(Trunk-based) 또는 짧은 수명의 기능 브랜치(Feature-branch) 워크플로우가 충돌을 방지하면서도 협업 효율성을 높이는 가장 실용적인 방법이라고 주장합니다 [15, 16, 32].
---
*Last updated: 2026-04-26*
+27
View File
@@ -0,0 +1,27 @@
---
id: DL-OPT-RMSPROP-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, deep-learning, optimization, rmsprop, learning-rate, gradient-descent, adaptive-learning]
last_reinforced: 2026-04-26
---
# [[RMSProp Optimizer (RMSProp 옵티마이저)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "최근 기울기의 제곱 평균을 활용해 학습의 보폭을 실시간으로 조율하고, 진동을 억제하며 전역 최적해(Global Optimum)를 향한 안정적인 항해를 지속하라" — 아다그라드(Adagrad)의 학습률 급감 문제를 지수 이동 평균(Exponential Moving Average)을 통해 개선한 적응형 학습률 최적화 알고리즘.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Adaptive Scaling and Gradient Normalization" — 과거의 모든 기울기가 아닌 '최근'의 기울기 에너지를 바탕으로 학습률을 나누어줌으로써, 가파른 경사에서는 보폭을 줄여 튕겨나가는 것을 방지하고 완만한 경사에서는 보폭을 키워 학습 속도를 유지하는 패턴.
- **핵심 메커니즘:**
- **Exponential Moving Average:** 과거 기울기 제곱의 영향을 감쇠 계수(Decay factor, $\rho$)를 통해 조절.
- **Learning Rate Normalization:** 기울기를 최근 제곱 평균의 제곱근(RMS)으로 나누어 업데이트.
- **의의:** 순환 신경망(RNN)이나 복잡한 딥러닝 모델에서 기울기 소실/폭주 문제를 완화하며 학습을 안정화하는 데 탁월한 성능을 보임.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 논문이 아닌 힌튼 교수의 Coursera 강의에서 처음 소개되었다는 독특한 역사를 가지고 있으며, 이후 등장한 Adam 옵티마이저의 핵심 구성 요소 중 하나가 되어 현대 최적화 이론의 근간이 됨.
- **정책 변화:** Antigravity 프로젝트는 시계열 데이터 처리나 RNN 계열 모델의 학습 시, 하이퍼파라미터 튜닝이 비교적 용이하고 안정성이 검증된 RMSProp을 우선적인 최적화 옵션으로 고려함.
## 🔗 지식 연결 (Graph)
- [[Optimization-Algorithms]], [[Adam-Optimizer-Foundations]], [[Backpropagation-Foundations]], [[Recurrent-Neural-Networks]]
- **Raw Source:** [[10_Wiki/Topics/AI/RMSProp-Optimizer.md]]
+27
View File
@@ -0,0 +1,27 @@
---
id: AI-MET-ROC-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, machine-learning, metrics, roc-curve, auc, classification, evaluation]
last_reinforced: 2026-04-26
---
# [[ROC-AUC Curves (ROC-AUC 곡선)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "임계값(Threshold)의 변화에도 흔들리지 않는 모델의 진정한 '변별력'을 한 장의 그래프와 하나의 숫자로 증명하라" — 분류 모델의 성능을 정밀도-재현율의 상충 관계 속에서 다각도로 평가하기 위한 표준 시각화 및 수치화 도구.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Threshold-Agnostic Performance Evaluation" — 모델이 정답과 오답을 얼마나 잘 갈라내는지(Discrimination)를 확인하기 위해, 모든 가능한 임계값에 대해 TPR(재현율)과 FPR(오탐율)의 궤적을 그리고 그 아래 면적(AUC)을 계산하는 패턴.
- **핵심 지표:**
- **ROC (Receiver Operating Characteristic):** 가로축 FPR, 세로축 TPR의 곡선. 왼쪽 상단에 붙을수록 고성능.
- **AUC (Area Under the Curve):** 곡선 아래 면적. 1.0에 가까울수록 완벽한 분류, 0.5는 무작위 추측.
- **의의:** 특정 임계값에서의 성능이 아닌, 모델의 전체적인 잠재력을 평가할 수 있게 해주며, 데이터 불균형 상황에서도 모델의 변별력을 비교적 객관적으로 나타냄.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** AUC가 높으면 무조건 좋다는 맹신에서 벗어나, 데이터가 극단적으로 불균형할 때는 ROC-AUC보다 PR-AUC(Precision-Recall AUC)가 모델의 실질적인 성능을 더 잘 반영할 수 있음을 인지해야 함.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 분류 모델 성능 보고 시, 단일 정확도(Accuracy) 지표 대신 ROC-AUC 점수를 병기하여 모델의 신뢰도를 다각도로 검증함.
## 🔗 지식 연결 (Graph)
- [[Precision-Recall-Tradeoff]], [[Performance-Metrics-in-AI]], [[Logistic-Regression]], [[Imbalanced-Data-Handling]]
- **Raw Source:** [[10_Wiki/Topics/AI/ROC-AUC-Curves.md]]
+28
View File
@@ -0,0 +1,28 @@
---
id: NLP-MET-ROUGE-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, nlp, metrics, rouge, summarization, evaluation, text-analysis]
last_reinforced: 2026-04-26
---
# [[ROUGE Metrics (ROUGE 메트릭)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "사람이 쓴 정답 요약문에서 지능(AI)이 얼마나 많은 핵심 단어와 문맥을 '재현'해냈는지를 정량적으로 측정하라" — 텍스트 요약 모델의 성능을 평가하기 위해 모델이 생성한 요약문과 참조 요약문 사이의 n-gram 겹침 정도를 계산하는 지표.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Recall-Oriented Overlap Analysis" — 요약의 목적은 '정보를 빠뜨리지 않는 것'에 있다는 관점에서, 참조 요약문의 단어들이 모델 출력에 얼마나 포함되어 있는지를 중심으로 성능을 산출하는 패턴.
- **주요 세부 지표:**
- **ROUGE-N:** 연속된 n개의 단어(Unigram, Bigram 등)가 얼마나 겹치는지 측정.
- **ROUGE-L:** 가장 긴 공통 부분 수열(LCS)을 기반으로 문장 구조의 유사성 측정.
- **ROUGE-W / ROUGE-S:** 가중치 적용 및 건너뛰기 허용 방식의 변형들.
- **의의:** 주관적일 수 있는 '요약의 품질'을 자동화된 수치로 환산하여, 수만 개의 요약 결과를 일관된 기준으로 비교하고 모델을 개선하게 함.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 단어가 많이 겹친다고 좋은 요약은 아니라는 한계(의미적 유사성 무시)를 극복하기 위해, 최근에는 BERTScore와 같은 시맨틱 임베딩 기반 지표나 LLM을 판별자로 쓰는 'LLM-as-a-judge' 방식이 보완적으로 사용됨.
- **정책 변화:** Antigravity 프로젝트는 1,174개 위키 문서의 자동 요약 기능을 검증할 때, 정보의 누락 여부를 확인하기 위해 ROUGE-L 지표를 기본 성능 평가 척도로 활용함.
## 🔗 지식 연결 (Graph)
- [[Natural-Language-Processing-NLP]], [[Performance-Metrics-in-AI]], [[RAG-and-Document-Retrieval]], [[Prompt-Engineering-Foundations]]
- **Raw Source:** [[10_Wiki/Topics/AI/ROUGE-Metrics.md]]
@@ -0,0 +1,28 @@
---
id: DL-ACT-RELU-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, deep-learning, activation-function, relu, vanishing-gradient, neural-networks, optimization]
last_reinforced: 2026-04-26
---
# [[ReLU Activation Functions (ReLU 활성화 함수)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "0보다 작으면 과감히 버리고, 0보다 크면 그대로 통과시켜 신경망의 '기울기 소실'이라는 동맥경화를 치료하라" — 딥러닝에서 가장 널리 쓰이는 비선형 활성화 함수로, 연산의 단순함과 학습의 효율성을 동시에 잡아 현대 신경망의 깊이를 가능케 한 핵심 도구.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Linear Rectification and Sparsity Inducement" — $f(x) = \max(0, x)$ 라는 단순한 수식을 통해 양수 영역에서는 기울기를 일정하게 유지하여 그래디언트 전파를 돕고, 음수 영역에서는 뉴런을 비활성화(Sparsity)하여 연산 효율을 높이는 패턴.
- **핵심 장점:**
- **Vanishing Gradient Solution:** 시그모이드(Sigmoid)와 달리 큰 양수 값에서도 기울기가 1로 유지되어 깊은 망 학습이 가능.
- **Computational Efficiency:** 단순한 비교 연산만으로 구현 가능하여 학습 속도가 매우 빠름.
- **Biological Plausibility:** 뇌세포의 특정 임계치 이상에서만 반응하는 특성을 일부 모방.
- **의의:** 딥러닝이 '학습 가능한 수준'으로 내려오게 만든 결정적인 공신 중 하나이며, AlexNet 이후 사실상의 표준(De facto standard)으로 자리 잡음.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 음수 영역에서 기울기가 0이 되어 뉴런이 영원히 죽어버리는 'Dying ReLU' 문제에 직면했으나, 이를 해결하기 위해 Leaky ReLU, ELU, GeLU(BERT에서 사용) 등 다양한 변형 모델이 등장하며 보완됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 내부 추론 신경망 설계 시, 학습 속도와 안정성의 균형을 위해 기본적으로 ReLU 혹은 그 변형인 GeLU를 활성화 함수로 채택함.
## 🔗 지식 연결 (Graph)
- [[Deep-Learning-Foundations]], [[Backpropagation-Foundations]], [[Optimization-in-AI]], [[Neural-Architecture-Design]]
- **Raw Source:** [[10_Wiki/Topics/AI/ReLU-Activation-Functions.md]]
@@ -0,0 +1,29 @@
---
id: MATH-REG-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [math, statistics, regression, linear-regression, predictive-modeling, least-squares]
last_reinforced: 2026-04-26
---
# [[Regression Analysis Foundations (회귀 분석 기초)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 흩어진 점들 사이에서 가장 설득력 있는 '추세의 선'을 긋고, 과거의 인과를 바탕으로 미래의 수치를 점쳐라" — 하나 이상의 독립 변수와 종속 변수 사이의 상관관계를 모델링하여 연속적인 수치를 예측하는 통계적 기법.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Linear Approximation and Error Minimization" — 데이터의 분포를 가장 잘 설명하는 함수(주로 직선)를 찾기 위해, 실제값과 예측값의 차이(잔차, Residuals)의 제곱합을 최소화하는 최소제곱법(Ordinary Least Squares)을 적용하는 패턴.
- **핵심 요소:**
- **Linear Regression:** 가장 기본적인 선형 모델. $y = ax + b$.
- **Multiple Regression:** 여러 개의 독립 변수를 사용하여 복합적인 영향 분석.
- **R-squared:** 모델이 데이터를 얼마나 잘 설명하는지 나타내는 결정계수.
- **Assumptions:** 선형성, 독립성, 등분산성, 정규성 가정을 전제로 함.
- **의의:** 기온에 따른 판매량 예측, 광고비 집행 대비 매출 분석 등 실생활의 수많은 인과 관계를 수치화하고 예측하는 머신러닝의 가장 강력한 베이스라인.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 선형 모델은 단순해서 한계가 있다는 인식에서 벗어나, 이제는 비선형 데이터도 특징 추출(Feature Engineering)이나 다항 회귀를 통해 효과적으로 처리하며, 해석 가능성(Interpretability)이 중요한 분야에서 여전히 최우선으로 선택됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 연산 소모량 및 응답 시간 예측 시, 복잡한 신경망 대신 가볍고 해석이 용이한 회귀 모델을 실시간 모니터링 엔진으로 사용함.
## 🔗 지식 연결 (Graph)
- [[Logistic-Regression]], [[Overfitting-and-Underfitting]], [[Predictive-Analytics]], [[Loss-Functions-Foundations]]
- **Raw Source:** [[10_Wiki/Topics/AI/Regression-Analysis-Foundations.md]]
@@ -0,0 +1,29 @@
---
id: AI-OPT-REG-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, deep-learning, regularization, overfitting, l1-lasso, l2-ridge, dropout, early-stopping]
last_reinforced: 2026-04-26
---
# [[Regularization Strategies (규제 전략)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "모델의 지능이 특정 데이터에만 매몰되지 않도록 가중치에 '벌금'을 매기거나 구조적 '결핍'을 부여하여, 어떤 상황에서도 유연하게 대응하는 일반화 능력을 확보하라" — 학습 오차를 줄이는 것과 모델의 복잡도를 낮추는 것 사이의 균형을 맞추어 과적합(Overfitting)을 방지하는 기술적 수단들.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Complexity Penalty and Stochastic Variation" — 손실 함수에 모델 크기에 비례하는 항을 추가하거나(L1/L2), 학습 시 무작위성을 주입하여(Dropout) 특정 경로에만 의존하지 않게 함으로써 모델의 강건성(Robustness)을 높이는 패턴.
- **주요 전략:**
- **L1 (Lasso):** 중요하지 않은 가중치를 0으로 만들어 변수 선택 효과 제공.
- **L2 (Ridge):** 가중치들을 전반적으로 작게 유지하여 급격한 변화 억제.
- **Dropout:** 학습 시 뉴런을 무작위로 생략하여 특정 뉴런에의 의존도 감소.
- **Early Stopping:** 검증 오차가 오르기 시작하는 시점에 학습을 중단.
- **의의:** AI 모델이 훈련 데이터의 노이즈까지 외워버리는 부작용을 막고, 본질적인 패턴만을 학습하게 유도하는 '최적화의 윤리'와 같은 역할.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 규제가 강할수록 정확도가 떨어진다는 우려는 이제 '검증 데이터'에 대한 일반화 성능 향상으로 상쇄되며, 현대 딥러닝에서는 드롭아웃과 배치 정규화(Batch Norm)를 함께 사용하는 것이 사실상의 표준 아키텍처가 됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 미세 조정 시, 소량의 데이터로도 범용적인 성능을 유지하기 위해 가중치 감쇠(Weight Decay)와 조기 종료 프로토콜을 필수적으로 가동함.
## 🔗 지식 연결 (Graph)
- [[Overfitting-and-Underfitting]], [[Optimization-in-AI]], [[Normalization-Strategies]], [[Performance-Metrics-in-AI]]
- **Raw Source:** [[10_Wiki/Topics/AI/Regularization-Strategies.md]]
+29
View File
@@ -0,0 +1,29 @@
---
id: SYS-RDB-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [systems, database, rdbms, sql, acid, normalization, postgresql, mysql]
last_reinforced: 2026-04-26
---
# [[Relational Databases (관계형 데이터베이스)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터를 엄격한 표(Table)의 형상으로 규격화하고 관계(Relation)라는 선으로 엮어, 단 한 점의 모순도 허용하지 않는 '데이터의 진실'을 기록하라" — 데이터를 행과 열로 이루어진 테이블로 구성하고, 공통된 속성을 매개로 서로 연결하여 관리하는 정형 데이터 저장 체계.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Structured Schema and Relational Normalization" — 데이터 중복을 최소화하기 위해 테이블을 쪼개고(Normalization), SQL이라는 표준 언어를 통해 복잡한 데이터를 결합(Join)하여 조회하며, 트랜잭션을 통해 데이터의 완결성을 보장하는 패턴.
- **핵심 특징 (ACID):**
- **Atomicity:** 작업은 전부 성공하거나 전부 실패해야 함.
- **Consistency:** 사전에 정의된 규칙을 준수하며 업데이트.
- **Isolation:** 동시 작업이 서로 간섭하지 않음.
- **Durability:** 성공한 작업은 시스템 장애 후에도 보존.
- **의의:** 금융, 물류, 인사 관리 등 한 치의 오차도 허용되지 않는 핵심 비즈니스 로직의 근간이며, 현대 데이터 사이언스에서 '구조화된 정보'의 핵심 원천.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 비정형 데이터의 폭증으로 NoSQL에 밀릴 것이라는 예측을 깨고, 최근에는 수평적 확장이 가능한 분산 RDB와 JSON 타입을 지원하는 유연한 RDBMS(PostgreSQL 등)의 등장으로 다시금 그 가치가 부각됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 기록, 사용자 프로필, 설정값 등 높은 무결성이 요구되는 정형 데이터는 표준 RDB 아키텍처에 저장하여 관리함.
## 🔗 지식 연결 (Graph)
- [[NoSQL-Databases]], [[Pivot-Table-Analysis]], [[System-Design-for-AI-Scale]], [[High-Availability-Systems]]
- **Raw Source:** [[10_Wiki/Topics/AI/Relational-Databases.md]]
+29
View File
@@ -0,0 +1,29 @@
---
id: UI-POS-REL-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ui-design, frontend, css, relative-positioning, layout, responsive-design, user-interface]
last_reinforced: 2026-04-26
---
# [[Relative Positioning (상대적 배치)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "고정된 좌표의 감옥에서 벗어나 주변과의 '관계' 속에서 자리를 잡고, 변화하는 환경(Viewport)에 유연하게 조응하는 질서를 부여하라" — 요소의 위치를 고정된 절대값이 아닌, 부모 요소나 주변의 다른 요소들과의 상대적인 거리를 기준으로 결정하는 디자인 및 레이아웃 배치 방식.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Hierarchical Flow and Adaptive Alignment" — 문서의 흐름(Flow)을 깨지 않으면서 현재 위치를 기준으로 미세 조정하거나, 부모 요소를 기준점(Origin)으로 삼아 하위 요소들의 가독성을 확보하는 레이아웃 패턴.
- **핵심 메커니즘:**
- **Relative to Self:** 자신의 원래 위치를 기준으로 상/하/좌/우 이동.
- **Relative to Parent:** 부모 박스의 경계선을 기준으로 정렬 (주로 Absolute와 결합).
- **Percentage-based:** 화면 너비나 높이에 비례한 크기와 간격 설정.
- **Flex/Grid Flow:** 주변 요소들과의 관계에 따라 자동으로 위치와 크기 조절.
- **의의:** 모바일, 태블릿, 데스크탑 등 다양한 디바이스 환경에서 일관된 사용자 경험을 제공하는 반응형 웹 디자인(Responsive Design)의 핵심 토대.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 픽셀(px) 단위의 정교한 배치가 최고라 믿던 시대에서, 이제는 다양한 해상도에 유연하게 대응하는 상대적 단위(em, rem, %, vh/vw)와 레이아웃 엔진(Flexbox, Grid) 중심의 설계로 패러다임이 완전히 전환됨.
- **정책 변화:** Antigravity 프로젝트의 모든 UI 컴포넌트는 사용자의 화면 환경에 상관없이 최적의 가독성을 유지하기 위해, 상대적 배치와 반응형 레이아웃 원칙을 엄격히 준수하여 제작됨.
## 🔗 지식 연결 (Graph)
- [[Modern-Website-Architecture]], [[Frontend-App-Development]], [[Product-Thinking-in-AI]], [[User-Interface-Design-Principles]]
- **Raw Source:** [[10_Wiki/Topics/AI/Relative-Positioning.md]]
+28
View File
@@ -0,0 +1,28 @@
---
id: IR-REL-FEEDBACK-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [information-retrieval, search, relevance-feedback, user-interaction, rocchio-algorithm, personalization]
last_reinforced: 2026-04-26
---
# [[Relevance Feedback (관련성 피드백)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "사용자의 만족과 불만족을 학습의 '나침반'으로 삼아, 모호한 질문(Query)을 정교한 정답의 좌표로 끊임없이 수정하라" — 정보 검색 시스템에서 사용자가 제시된 결과의 유용성을 평가하면, 그 피드백을 반영하여 검색 쿼리를 개선하고 더 관련성 높은 결과를 도출하는 상호작용 기법.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Iterative Query Refinement and Vector Shifting" — 사용자가 선택한 '좋은 문서' 쪽으로 검색 벡터를 이동시키고(Rocchio Algorithm), 선택하지 않은 '나쁜 문서'로부터는 멀어지게 하여, 사용자의 실제 의도(Intent)에 검색 엔진의 초점을 맞추는 패턴.
- **주요 피드백 방식:**
- **Explicit Feedback:** 사용자가 직접 "좋아요/싫어요" 혹은 별점을 매김.
- **Implicit Feedback:** 사용자의 클릭, 체류 시간, 구매 이력 등을 통해 의도를 추정.
- **Pseudo Relevance Feedback:** 상위 n개 결과가 무조건 맞다고 가정하고 자동으로 쿼리를 확장.
- **의의:** 사용자가 자신의 의도를 완벽한 키워드로 설명하지 못하더라도, 시스템과의 반복적인 상호작용을 통해 최적의 정보에 도달하게 함.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 키워드를 추가하던 방식에서, 이제는 거대 언어 모델(LLM)이 사용자의 피드백 문맥을 이해하여 질문 자체를 다시 쓰는(Query Rewriting) 지능형 피드백 시스템으로 고도화됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 답변에 대한 사용자의 수정이나 추가 질문을 '강력한 관련성 피드백'으로 인지하여, 다음 검색 시 해당 피드백이 반영된 최적의 지식 노드를 우선적으로 탐색함.
## 🔗 지식 연결 (Graph)
- [[Ranking-Algorithms]], [[RAG-and-Document-Retrieval]], [[Reinforcement-Learning]], [[Performance-Metrics-in-AI]]
- **Raw Source:** [[10_Wiki/Topics/AI/Relevance-Feedback.md]]
+12 -12
View File
@@ -1,28 +1,28 @@
---
id: REP-LEARN-001
id: AI-REP-LEARN-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, deep-learning, machine-learning, embeddings, feature-engineering]
tags: [ai, deep-learning, representation-learning, feature-learning, self-supervised-learning, embeddings, autoencoders]
last_reinforced: 2026-04-26
---
# [[Representation Learning (표현 학습)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터를 해석하는 가장 유용한 '언어'를 스스로 찾아라" — 사람이 직접 특징(Feature)을 설계하는 대신, 신경망이 원시 데이터로부터 태스크 수행에 최적인 추상적 특징이나 벡터 표현을 자동으로 추출하도록 학습하는 방식.
> "데이터의 겉모습(Raw pixels)에 현혹되지 말고, 그 이면에 숨겨진 본질적 의미와 구조를 '고밀도 벡터(Embedding)'로 압축하여 지능의 언어로 번역하라" — 복잡한 데이터를 기계가 처리하기 쉬운 유용한 특징(Feature)들로 자동 변환하는 딥러닝의 핵심 메커니즘.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** 고차원의 복잡한 원시 데이터(이미지 픽셀, 텍스트 토큰)를 의미가 응축된 저차원의 잠재 공간(Latent Space) 벡터로 변환하여 학습 효율을 극대화하는 패턴.
- **세부 내용:**
- **Feature Engineering vs Learning:** 수동으로 특징을 정의하던 과거 방식에서 벗어나, 데이터 내에 숨겨진 구조를 스스로 파악.
- **Manifold Hypothesis:** 고차원 데이터는 사실 낮은 차원의 부분 공간(Manifold)에 밀집되어 있다는 가설을 바탕으로 데이터를 압축.
- **Transfer Learning:** 잘 학습된 표현(예: ImageNet으로 학습된 특징 추출기)은 새로운 태스크에서도 재사용 가능함.
- **Disentangled Representation:** 데이터의 각 특징(색상, 모양, 위치 등)이 독립적인 차원으로 분리되어 학습되도록 유도.
- **추출된 패턴:** "Feature Discovery and Manifold Learning" — 원시 데이터의 고차원 공간에서 유의미한 정보가 밀집된 저차원 매니폴드를 찾아내고, 이를 통해 분류, 생성, 검색 등 다양한 작업에 즉시 활용 가능한 공용 표현(Representation)을 학습하는 패턴.
- **핵심 접근법:**
- **Self-supervised Learning:** 데이터 자체의 구조(가려진 단어 맞추기 등)를 통해 정답지 없이 본질을 학습.
- **Autoencoders:** 데이터를 압축했다가 복원하는 과정을 통해 핵심 특징 추출.
- **Contrastive Learning:** 비슷한 것은 가깝게, 다른 것은 멀게 배치하여 의미적 거리 학습.
- **의의:** 사람이 직접 특징을 설계하던 '피처 엔지니어링'의 시대를 종식시키고, 데이터만 충분하다면 AI가 스스로 최적의 특징을 찾아내게 함으로써 딥러닝 혁명을 이끔.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 데이터 분석의 핵심이 '알고리즘'에서 데이터를 어떻게 '표현'하느냐의 문제로 이동하며 딥러닝 혁명을 이끔.
- **정책 변화:** Antigravity 프로젝트의 '지식 임베딩' 시스템은 모든 위키 문서를 의미적 특징이 살아있는 벡터 표현으로 변환하여, 질문의 의도에 맞는 문서를 고도의 정확도로 검색함.
- **과거 데이터와의 충돌:** 단순히 차원을 줄이는 것이 목표였던 과거와 달리, 이제는 해석 가능성(Disentanglement)을 높이거나 전이 학습(Transfer Learning)이 용이한 범용적인 표현을 만드는 것이 현대 표현 학습의 화두임.
- **정책 변화:** Antigravity 프로젝트 모든 지식 문서를 고차원 벡터 표현하여 시맨틱 관계를 추론하는 임베딩 엔진을 운용하며, 이를 통해 문서 간의 보이지 않는 연결 고리를 스스로 찾아내는 표현 학습 기반의 가드닝을 수행함.
## 🔗 지식 연결 (Graph)
- [[Deep-Learning]], [[Word-Embeddings]], [[Autoencoder]], [[Transfer-Learning]]
- [[Deep-Learning-Foundations]], [[Vector-Database-Foundations]], [[Self-Supervised-Learning-Foundations]], [[Dimensionality-Reduction-Strategies]]
- **Raw Source:** [[10_Wiki/Topics/AI/Representation-Learning.md]]
+29
View File
@@ -0,0 +1,29 @@
---
id: DL-RES-ARCH-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, deep-learning, resnet, neural-architecture, computer-vision, bottleneck-layer, model-design]
last_reinforced: 2026-04-26
---
# [[ResNet Architectures (ResNet 아키텍처)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "작은 망(18, 34)은 정직한 결합(Basic Block)으로, 거대한 망(50, 101, 152)은 압축된 결합(Bottleneck)으로 설계하여 성능과 연산 효율의 정교한 밸런스를 달성하라" — 잔차 학습 원리를 바탕으로 층의 깊이와 복잡도를 체계적으로 설계한 ResNet 시리즈의 구체적 명세와 변형 모델들.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Structural Scaling and Resource Optimization" — 얕은 층에서는 연산 성능을 위해 단순한 2층 구조를 사용하고, 깊은 층에서는 연산 비용을 줄이기 위해 $1 \times 1$ 컨볼루션을 활용한 3층 보틀넥 구조를 채택하여 전체 파라미터 수를 관리하는 패턴.
- **주요 아키텍처 명세:**
- **ResNet-18 / 34:** Basic Block ($3 \times 3$ Conv 위주) 사용. 중소규모 데이터셋에 적합.
- **ResNet-50 / 101 / 152:** Bottleneck Block ($1 \times 1, 3 \times 3, 1 \times 1$ Conv) 사용. 대규모 데이터셋과 복잡한 특징 추출에 강점.
- **Wide ResNet:** 깊이 대신 너비(Channel)를 키워 성능 향상.
- **ResNeXt:** 그룹 컨볼루션(Grouped Conv)을 도입하여 '기수(Cardinality)'라는 새로운 차원의 확장 제시.
- **의의:** 정형화된 아키텍처 설계 공식을 제공함으로써 연구자와 엔지니어들이 각자의 하드웨어 자원과 문제 난이도에 맞는 최적의 모델을 손쉽게 선택할 수 있게 함.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 레이어를 쌓기만 하면 성능이 좋아진다는 초기 기대와 달리, 일정 깊이 이상에서는 모델의 너비나 기수를 키우는 것이 하드웨어 효율과 정확도 측면에서 더 유리하다는 사실이 밝혀지며 모델 설계 트렌드가 변화함.
- **정책 변화:** Antigravity 프로젝트는 비전 서비스의 요구 성능에 따라 엣지 기기용(ResNet-18)부터 고성능 서버용(ResNet-101/152)까지 최적화된 아키텍처 프리셋을 제공함.
## 🔗 지식 연결 (Graph)
- [[Residual-Networks]], [[Deep-Learning-Foundations]], [[Convolutional-Neural-Networks-CNN]], [[Model-Compression-and-Deployment]]
- **Raw Source:** [[10_Wiki/Topics/AI/ResNet-Architectures.md]]
+28
View File
@@ -0,0 +1,28 @@
---
id: DL-RESNET-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, deep-learning, resnet, residual-learning, skip-connection, neural-architecture, computer-vision]
last_reinforced: 2026-04-26
---
# [[Residual Networks (ResNet, 잔차 네트워크)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "기존 지식(Input)을 출력에 그대로 더하는 '지능의 고속도로(Skip Connection)'를 건설하여, 신경망의 깊이가 성능의 족쇄가 아닌 엔진이 되게 하라" — 층이 깊어질수록 학습 성능이 오히려 떨어지는 퇴화(Degradation) 문제를 해결하기 위해 잔차 학습(Residual Learning) 개념을 도입한 획기적인 신경망 아키텍처.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Identity Mapping and Gradient Propagation" — 모델이 복잡한 매핑($H(x)$)을 직접 배우는 대신, 입력 대비 변화량($F(x) = H(x) - x$)인 잔차만을 배우게 하고 입력값($x$)은 그대로 전달(Shortcut)하여 깊은 층에서도 기울기 소실을 방지하는 패턴.
- **핵심 혁신:**
- **Skip Connections:** 층과 층 사이를 건너뛰는 연결로 그래디언트의 원활한 역전파 보장.
- **Residual Block:** 입력을 그대로 보존하는 항등 매핑(Identity Mapping) 구조.
- **Architecture Depth:** 18층에서 시작해 152층 이상의 극단적으로 깊은 네트워크 학습 가능.
- **의의:** ILSVRC 2015 우승을 기점으로 딥러닝 아키텍처 설계의 패러다임을 바꿨으며, 현재는 트랜스포머를 포함한 거의 모든 현대 신경망의 필수 요소로 자리 잡음.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 층이 깊을수록 무조건 좋다는 맹신에서 벗어나, 이제는 스킵 연결이 사실상 얕은 네트워크들의 앙상블 효과를 낸다는 해석이 힘을 얻고 있으며, 이를 통해 네트워크의 유효 깊이(Effective Depth)를 관리하는 방향으로 발전함.
- **정책 변화:** Antigravity 프로젝트는 비전 및 오디오 인식 모델의 백본(Backbone) 설계 시, 학습 안정성과 성능이 검증된 ResNet 계열 아키텍처를 최우선 베이스라인으로 활용함.
## 🔗 지식 연결 (Graph)
- [[ResNet-Architectures]], [[Deep-Learning-Foundations]], [[Backpropagation-Foundations]], [[ReLU-Activation-Functions]]
- **Raw Source:** [[10_Wiki/Topics/AI/Residual-Networks.md]]
+28
View File
@@ -0,0 +1,28 @@
---
id: RL-REWARD-SHAPE-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, reinforcement-learning, reward-shaping, reward-design, sparse-rewards, behavior-steering]
last_reinforced: 2026-04-26
---
# [[Reward Shaping in RL (강화학습에서의 보상 설계)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "최종 목표라는 커다란 보상을 향해 가기 위해, 에이전트의 발걸음마다 '올바른 방향'을 가리키는 작은 이정표(Sub-rewards)를 설계하라" — 보상이 희소한(Sparse Reward) 환경에서 학습 속도를 높이기 위해 보상 함수에 추가적인 지침을 더하는 기법.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Intermediate Incentivization and Alignment Steering" — 최종 성공 시에만 보상을 주는 대신, 목표에 가까워지는 상태 전이마다 보상을 부여하여 에이전트가 '무엇이 좋은 행동인지'를 빠르게 파악하게 만드는 패턴.
- **주요 고려 사항:**
- **Potential-based Reward Shaping:** 정책의 최적성을 해치지 않으면서 보상을 추가하는 수학적 기법.
- **Reward Hacking Risk:** 에이전트가 개발자의 의도와 달리 꼼수를 써서 보상만 극대화하는 부작용 주의.
- **Dense vs Sparse:** 너무 촘촘한 보상은 국소 최적해(Local Optimum)에 빠뜨릴 수 있고, 너무 희소한 보상은 학습 자체를 불가능하게 함.
- **의의:** 복잡한 로봇 제어나 전략 게임처럼 성공까지의 과정이 긴 문제에서 AI의 학습 효율을 결정짓는 가장 결정적인 '교육학적 설계' 과정.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 보상을 많이 줄수록 똑똑해진다는 단순한 믿음에서 벗어나, 이제는 보상을 최소화하되 에이전트의 '호기심(Curiosity)'이나 '자기 주도적 탐색'을 장려하는 내적 동기(Intrinsic Motivation) 연구로 트렌드가 변화함.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 작업 완수도 평가 시, 최종 결과뿐만 아니라 효율적인 도구 사용 및 불필요한 연산 방지 등 각 단계별 '좋은 습관'에 가중치를 주는 보상 체계를 적용함.
## 🔗 지식 연결 (Graph)
- [[Reinforcement-Learning]], [[Positive-Reinforcement]], [[Markov-Decision-Process-MDP]], [[Exploration-vs-Exploitation]]
- **Raw Source:** [[10_Wiki/Topics/AI/Reward-Shaping-in-RL.md]]
+28
View File
@@ -0,0 +1,28 @@
---
id: MATH-REG-RID-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [math, statistics, machine-learning, regression, l2-regularization, ridge-regression, overfitting]
last_reinforced: 2026-04-26
---
# [[Ridge Regression (릿지 회귀)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 노이즈에 과민반응하지 않도록 가중치의 제곱합(L2)을 제한하여, 부드럽고 강건한 예측의 곡선을 설계하라" — 선형 회귀의 손실 함수에 가중치의 제곱에 비례하는 페널티 항을 추가하여 모델의 복잡도를 제어하고 과적합을 방지하는 규제 기법.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Weight Shrinkage and Variance Reduction" — 모든 가중치를 골고루 0에 가깝게 수렴시키되 완전히 0으로 만들지는 않음으로써, 특정 변수에 대한 과도한 의존성을 줄이고 모델의 일반화 성능(Generalization)을 높이는 패턴.
- **핵심 메커니즘:**
- **L2 Regularization:** 가중치 벡터의 L2 노름(Norm)을 최소화.
- **Hyperparameter $\lambda$ (Lambda):** 규제의 강도를 조절. 값이 클수록 규제가 강해짐.
- **Bias-Variance Tradeoff:** 편향(Bias)은 약간 증가시키되 분산(Variance)을 대폭 낮추어 전체 오차 최소화.
- **의의:** 다중공선성(Multicollinearity) 문제가 있는 데이터셋에서 선형 회귀보다 훨씬 안정적인 성능을 보이며, 거의 모든 머신러닝 모델의 기본 규제 장치로 활용됨.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 변수를 완전히 제거하여 모델을 단순화하려는 Lasso(L1)와 달리, 데이터의 모든 정보를 조금씩이라도 유지하려는 특성이 있어 변수 간 상관관계가 높은 실전 데이터에서 종종 더 우수한 성능을 나타냄.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 성능 예측 모델 구축 시, 소수의 성능 지표에만 치우치지 않는 균형 잡힌 판단을 위해 릿지 회귀 기반의 규제 로직을 적용함.
## 🔗 지식 연결 (Graph)
- [[Regression-Analysis-Foundations]], [[Regularization-Strategies]], [[Overfitting-and-Underfitting]], [[Loss-Functions-Foundations]]
- **Raw Source:** [[10_Wiki/Topics/AI/Ridge-Regression.md]]
@@ -0,0 +1,29 @@
---
id: BIZ-RISK-AI-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, risk-management, security, finance, fraud-detection, predictive-modeling, safety]
last_reinforced: 2026-04-26
---
# [[Risk Assessment with AI (AI를 통한 위험 평가)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 바다에서 보이지 않는 위기의 전조를 실시간으로 탐지하고, 확률이라는 무기로 미래의 손실을 선제적으로 방어하라" — 인공지능과 머신러닝 모델을 활용하여 특정 사건(사기, 고장, 부도 등)이 발생할 가능성을 예측하고 그 영향력을 평가하는 지능형 관리 기법.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Anomaly Detection and Probabilistic Scoring" — 과거의 정상 패턴에서 벗어난 행동이나 특이치를 탐지하고, 수천 개의 변수를 종합하여 위험 점수(Risk Score)를 산출함으로써 의사결정의 근거를 제공하는 패턴.
- **주요 활용 분야:**
- **Finance:** 부정 결제 탐지(FDS), 개인 신용 평가(Credit Scoring).
- **Cybersecurity:** 실시간 위협 탐지 및 제로 데이(Zero-day) 공격 대응.
- **Industry:** 설비 고장 예측(Predictive Maintenance) 및 사고 예방.
- **Insurance:** 사고 발생 확률 기반의 보험료 산정 및 허위 청구 탐지.
- **의의:** 인간의 직관으로 파악하기 어려운 복합적인 위험 요소를 수치화하여, 비즈니스의 안정성을 획기적으로 높이고 자원 배분을 최적화함.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 고정된 규칙(Rule-based) 기반의 차단에서 벗어나, 이제는 사용자의 평소 습관과 맥락(Context)을 이해하는 행동 기반 AI 모델을 통해 오탐(False Positive)을 줄이고 정교한 탐지가 가능해짐.
- **정책 변화:** Antigravity 프로젝트는 에이전트가 생성한 지식의 신뢰도를 실시간으로 평가하며, 할루시네이션이나 편향된 정보가 포함될 위험을 수치화하여 사용자에게 사전에 경고하는 리스크 가드레일을 운용함.
## 🔗 지식 연결 (Graph)
- [[Predictive-Analytics]], [[Outlier-Detection-Techniques]], [[Trustworthy-AI]], [[Process-Automation-with-AI]]
- **Raw Source:** [[10_Wiki/Topics/AI/Risk-Assessment-with-AI.md]]
+29
View File
@@ -0,0 +1,29 @@
---
id: ROBOT-FOUND-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [robotics, ai, kinematics, dynamics, ros, slam, automation, physical-computing]
last_reinforced: 2026-04-26
---
# [[Robotics Foundations (로보틱스 기초)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 바다를 넘어 물리적 실체(Physical Body)를 가진 지능을 구현하고, 감각(Sense)-판단(Think)-실행(Act)의 루프를 통해 현실 세계의 난제들을 직접 해결하라" — 공학, 컴퓨터 과학, 수학적 원리를 결합하여 물리적 환경에서 자율적으로 작업을 수행하는 기계 시스템을 설계하고 제어하는 기술적 기반.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Sense-Think-Act Loop and Spatial Reasoning" — 센서 데이터를 통해 환경을 인지하고, 최적의 경로와 동작을 계산하여, 액추에이터를 통해 물리적 힘을 전달하는 폐쇄 루프(Closed-loop) 제어 패턴.
- **핵심 구성 요소:**
- **Hardware:** 센서(Lidar, Camera), 액추에이터(Motor), 컨트롤러.
- **Kinematics & Dynamics:** 로봇 팔의 위치와 가해지는 힘의 수학적 모델링.
- **SLAM:** 자신의 위치를 파악하며 동시에 지도를 만드는 자율 주행의 기초 기술.
- **Software Framework (ROS):** 분산된 로봇 모듈 간의 통신과 제어를 돕는 표준 운영 체제.
- **의의:** AI를 디지털 스크린 속에 가두지 않고 제조, 의료, 탐사, 서비스 등 실질적인 인간의 삶의 현장으로 확장시키는 지능의 물리적 완성형.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 엄격한 코딩에 기반한 제어에서 벗어나, 이제는 강화학습을 통해 로봇이 시행착오를 겪으며 스스로 걷거나 물체를 잡는 법을 배우는 '학습 기반 로보틱스(Learning-based Robotics)'로 패러다임이 이동함.
- **정책 변화:** Antigravity 프로젝트는 향후 지능형 에이전트의 물리적 확장성을 고려하여, ROS 통신 규약과 호환되는 인터페이스 설계를 지향하며 가상 환경에서의 로봇 시뮬레이션 지식을 강화함.
## 🔗 지식 연결 (Graph)
- [[PID-Controllers-in-AI]], [[Reinforcement-Learning]], [[Computer-Vision-Fundamentals]], [[Point-Cloud-Processing]]
- **Raw Source:** [[10_Wiki/Topics/AI/Robotics-Foundations.md]]
@@ -0,0 +1,28 @@
---
id: AI-ROBUST-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, machine-learning, robustness, adversarial-attacks, ood-detection, reliability, trustworthy-ai]
last_reinforced: 2026-04-26
---
# [[Robust Machine Learning (강건한 머신러닝)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "데이터의 노이즈와 적대적 공격이라는 폭풍우 속에서도 흔들리지 않는 '강건한 지능'을 구축하고, 낯선 환경에서도 신뢰할 수 있는 판단의 일관성을 유지하라" — 모델이 입력 데이터의 변동, 노이즈, 혹은 의도적인 왜곡(Adversarial Perturbation)에 대해 안정적인 성능을 유지하도록 만드는 머신러닝 방법론.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Adversarial Defense and Uncertainty Awareness" — 학습 과정에서 의도적으로 어려운 샘플을 주입하여 단련시키고(Adversarial Training), 자신이 모르는 데이터(OOD)에 대해서는 "모른다"고 답할 수 있는 확신도(Confidence)를 관리하는 패턴.
- **핵심 도전 과제:**
- **Adversarial Attacks:** 사람 눈에는 보이지 않는 미세한 변조로 모델을 속이는 공격 방어.
- **Distribution Shift:** 학습 데이터와 실제 데이터의 분포가 달라질 때의 성능 하락 방지.
- **Data Corruption:** 데이터 수집 과정의 결측이나 오류에 대한 저항력 확보.
- **의의:** 자율주행, 의료 진단, 안보 등 작은 오류가 치명적인 결과를 초래하는 '미션 크리티컬' 분야에서 AI가 상용화되기 위한 필수 조건.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 정확도(Accuracy)만 높으면 좋은 모델이라는 지표 지상주의에서 벗어나, 이제는 최악의 상황에서도 얼마나 안정적인지(Worst-case Robustness)가 모델의 진정한 가치를 결정하는 핵심 척도가 됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 판단 로직 배포 전, 적대적 샘플 테스트와 이상 데이터 탐지 성능을 반드시 검증하여 예외 상황에 대한 강건성을 확보하는 'Robust-First' 정책을 고수함.
## 🔗 지식 연결 (Graph)
- [[Trustworthy-AI]], [[Adversarial-Machine-Learning]], [[OOD-Detection-Techniques]], [[Outlier-Detection-Techniques]]
- **Raw Source:** [[10_Wiki/Topics/AI/Robust-Machine-Learning.md]]
@@ -0,0 +1,27 @@
---
id: MATH-MET-RMSE-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [math, statistics, metrics, rmse, regression, evaluation, error-analysis]
last_reinforced: 2026-04-26
---
# [[Root Mean Square Error (RMSE, 평균 제곱근 오차)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "실제와 예측 사이의 거리를 제곱의 무게로 평가하여 큰 실수를 엄하게 다스리고, 원본 데이터와 동일한 척도로 모델의 정밀도를 진단하라" — 회귀 모델의 예측 오차를 측정하는 가장 대표적인 지표로, 오차의 크기에 비례하여 패널티를 부여하는 통계적 척도.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Quadratic Error Scaling and Dimensional Consistency" — 개별 오차를 제곱하여 합산함으로써 큰 오차(Outliers)가 지표에 미치는 영향력을 증폭시키고, 마지막에 제곱근을 취해 결과값을 원본 종속 변수와 같은 단위로 맞추어 해석력을 높이는 패턴.
- **핵심 특징:**
- **Sensitivity to Outliers:** MAE(평균 절대 오차)에 비해 큰 오차에 매우 민감하게 반응함.
- **Interpretability:** 예측값의 단위(예: 원, kg)와 동일하게 표현되어 오차의 실질적 크기를 체감하기 쉬움.
- **의의:** "큰 실수는 절대 안 된다"는 목적이 뚜렷한 예측 모델링(예: 기상 예보, 금융 변동성)에서 모델의 신뢰성을 평가하는 최우선 지표로 활용됨.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** RMSE가 낮다고 무조건 완벽한 것은 아니며, 데이터에 이상치가 많을 경우 RMSE는 소수의 이상치에 휘둘려 모델의 전반적인 성능을 왜곡할 수 있으므로 MAE나 R-squared와 함께 분석하는 것이 권장됨.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 연산 리소스 예측 모델의 오차율을 모니터링할 때, 갑작스러운 부하 폭증을 방지하기 위해 큰 오차를 엄격히 감시하는 RMSE 지표를 주력으로 사용함.
## 🔗 지식 연결 (Graph)
- [[Regression-Analysis-Foundations]], [[Performance-Metrics-in-AI]], [[Loss-Functions-Foundations]], [[Predictive-Analytics]]
- **Raw Source:** [[10_Wiki/Topics/AI/Root-Mean-Square-Error.md]]
+29
View File
@@ -0,0 +1,29 @@
---
id: AI-RULE-BASED-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [ai, expert-systems, rule-based, logic, if-then, deterministic, symbolic-ai]
last_reinforced: 2026-04-26
---
# [[Rule-based Systems (규칙 기반 시스템)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "인간의 전문 지식을 '논리의 조건문'으로 명문화하여, 한 치의 오차도 허용하지 않는 투명하고 결정론적인 지능을 구축하라" — 사전에 정의된 규칙(If-Then)들의 집합을 통해 데이터를 처리하고 결론을 도출하는 인공지능의 가장 고전적이고 확실한 형태.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Knowledge Encoding and Deterministic Execution" — 도메인 전문가의 지식을 명시적인 규칙으로 코딩하고, 추론 엔진(Inference Engine)이 입력 데이터와 규칙을 대조하여 결과를 도출하는 패턴.
- **주요 특징:**
- **Explainability:** 결과의 도출 과정이 논리적으로 명확하여 추적이 용이함.
- **No Data Required:** 학습 데이터 없이도 전문가의 지식만으로 시스템 구축 가능.
- **Brittleness:** 정의되지 않은 예외 상황(Out-of-rule)에서는 작동 불능.
- **Scalability Issue:** 규칙이 수만 개로 늘어나면 규칙 간 충돌과 유지보수 비용 폭증.
- **의의:** 법률, 금융 규제, 의료 가이드라인 등 절대적인 '준수'와 '설명'이 필요한 분야에서 딥러닝의 불확실성을 보완하는 핵심 장치로 여전히 강력함.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 딥러닝에 밀려 사라질 기술이라는 오해를 깨고, 최근에는 신경망의 유연함과 규칙 기반의 안정성을 결합한 '뉴로-심볼릭(Neuro-symbolic) AI'나 LLM의 답변을 제어하는 '가드레일' 기술로 화려하게 부활함.
- **정책 변화:** Antigravity 프로젝트는 에이전트의 자율적 판단 이전에, 보안 및 프로젝트 준수 사항에 대해 엄격한 규칙 기반의 필터링 시스템을 최우선적으로 가동하여 안전성을 담보함.
## 🔗 지식 연결 (Graph)
- [[Symbolic-AI-Foundations]], [[Expert-Systems-Best-Practices]], [[Trustworthy-AI]], [[Prompt-Engineering-Foundations]]
- **Raw Source:** [[10_Wiki/Topics/AI/Rule-based-Systems.md]]
+30
View File
@@ -0,0 +1,30 @@
---
id: MATH-SAMPLING-001
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 1.0
tags: [math, statistics, sampling, data-science, bootstrap, stratified-sampling, monte-carlo]
last_reinforced: 2026-04-26
---
# [[Sampling Techniques (샘플링 기법)]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> "전체의 거대함에 압도되지 말고 대표성 있는 조각(Sample)을 정교하게 도려내어, 최소한의 자원으로 최대한의 진실을 추론하라" — 모집단 전체를 조사하는 대신 그 일부를 추출하여 전체의 특성을 파악하고 분석 효율을 극대화하는 통계적 방법론.
## 📖 구조화된 지식 (Synthesized Content)
- **추출된 패턴:** "Representative Subset Extraction and Bias Mitigation" — 무작위성을 기반으로 하되, 데이터의 층(Strata)이나 구조를 고려하여 표본이 특정 집단에 편중되지 않게 함으로써 추론의 오차(Sampling Error)를 최소화하는 패턴.
- **주요 기법:**
- **Simple Random Sampling:** 모든 요소에게 동일한 추출 기회 부여.
- **Stratified Sampling:** 모집단을 성격이 다른 그룹으로 나누고 각 그룹에서 비례하여 추출 (불균형 데이터 해결).
- **Systematic Sampling:** 일정한 간격으로 추출.
- **Importance Sampling:** 확률 분포가 희소한 지점의 샘플링 효율을 높이는 기법 (강화학습에서 활용).
- **Bootstrap:** 중복 허용 샘플링 (앙상블 학습의 기초).
- **의의:** 빅데이터 시대에도 전수 조사는 비용과 시간 면에서 불가능한 경우가 많으며, 샘플링은 데이터 분석과 머신러닝 학습의 속도와 타당성을 결정짓는 핵심 공정임.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 단순히 많이 뽑는 것이 좋다는 생각에서 벗어나, 이제는 데이터의 양보다 '얼마나 편향되지 않게 뽑았는가'가 중요해졌으며, 생성 모델(GAN, Diffusion)의 출력 이미지를 고르는 정교한 샘플링 전략으로까지 확장됨.
- **정책 변화:** Antigravity 프로젝트는 1,174개 지식 자산의 품질 검수 시, 시간 효율을 위해 전체의 5%를 층화 추출하여 정밀 검토하는 샘플링 기반의 품질 관리(QA) 프로토콜을 수행함.
## 🔗 지식 연결 (Graph)
- [[Pre-processing-Data-for-AI]], [[Prioritized-Experience-Replay]], [[Random-Forest-Classifiers]], [[Probability-Theory-Foundations]]
- **Raw Source:** [[10_Wiki/Topics/AI/Sampling-Techniques.md]]