[P-Reinforce] Inventory items 22-31 fulfilled (Batch 09)
This commit is contained in:
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-BELLMAN
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [Bellman Equation, Reinforcement Learning, Dynamic Programming, MDP]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Bellman-Equation]] (벨만 방정식)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "오늘의 선택은 내일의 가치를 품고 있다." 현재 상태의 가치를 '현재 받는 보상'과 '다음 상태의 기대 가치'의 합으로 정의하는 강화학습과 동적 계획법의 수학적 초석이다.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **Recursive Structure**:
|
||||
- 복잡한 미래의 합을 현재와 바로 다음 단계의 관계로 쪼갬으로써, 거대한 의사결정 문제를 계산 가능한 단위로 분해한다.
|
||||
- **State-Value Function (V)**:
|
||||
- 특정 상태에 있는 것이 장기적으로 볼 때 얼마나 좋은지 수치화한다.
|
||||
- **Action-Value Function (Q)**:
|
||||
- 특정 상태에서 특정 행동을 하는 것이 얼마나 좋은지 수치화하며, 이는 Q-Learning의 핵심이 된다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
- 벨만 방정식은 환경의 변화를 완벽히 안다는 가정하에 작동한다. 실제 세상처럼 환경이 불투명할 때는 근사치(Approximation)를 사용하는 Deep Q-Network(DQN) 등이 대안으로 사용된다.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: [[DQN]] , [[Reinforcement-Learning]]
|
||||
- Foundation: [[Computational Theory & Math/Information Theory]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-BERT
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 0.99
|
||||
tags: [BERT, NLP, Transformer, Language Model, Transfer Learning]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Bert-Language-Model]] (BERT 언어 모델)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "단어의 앞뒤 맥락을 동시에 읽는 천재." 문장을 왼쪽에서 오른쪽으로만 읽던 기존 방식을 탈피하여, 양방향(Bidirectional)으로 문맥을 파악해 언어 이해 능력을 극대화한 트랜스포머 기반 모델이다.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **Masked Language Model (MLM)**:
|
||||
- 문장의 일부 단어를 가리고(Masking), 주변 단어들을 통해 가려진 단어를 맞추는 방식으로 언어의 구조를 스스로 학습한다.
|
||||
- **Next Sentence Prediction (NSP)**:
|
||||
- 두 문장이 이어지는 문장인지 판단하는 태스크를 통해 문장 간의 관계와 논리적 흐름을 파악한다.
|
||||
- **Transfer Learning**:
|
||||
- 방대한 텍스트로 미리 학습(Pre-training)된 BERT를 특정 작업(질의응답, 감성 분석 등)에 맞춰 살짝 미세 조정(Fine-tuning)하여 최강의 성능을 낸다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
- BERT는 '이해'는 뛰어나지만 '생성(Generation)'에는 적합하지 않다. 생성형 AI 시대에는 GPT 같은 디코더(Decoder) 기반 모델이 주류지만, 검색이나 분류 같은 분석 작업에서는 여전히 BERT가 가성비 최고의 왕좌를 지키고 있다.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: [[Transformer-Architecture]] , [[Natural-Language-Processing]]
|
||||
- Context: [[Artificial-Intelligence]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-BIAS-CORR
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 0.98
|
||||
tags: [Bias Correction, AI Ethics, Algorithmic Fairness, Statistics]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Bias-Correction-Algorithm]] (편향 보정 알고리즘)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "데이터의 편견은 모델의 차별이 된다." 특정 인구통계학적 특성에 치우친 데이터를 수학적으로 재조정하여, AI가 공정하고 객관적인 판결을 내리도록 강제하는 기술적 윤리 장치다.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **Pre-processing Techniques**:
|
||||
- 학습 전 데이터셋에서 편향된 샘플의 가중치를 조절하거나(Reweighing), 정보를 제거하여 모델이 편견을 학습하지 못하게 한다.
|
||||
- **In-processing Approaches**:
|
||||
- 손실 함수(Loss function)에 '공정성 제약 조건'을 추가하여, 정확도뿐만 아니라 공정성 점수도 함께 최적화한다.
|
||||
- **Post-processing Calibration**:
|
||||
- 모델의 예측 결과가 나온 뒤, 특정 집단에 대해 임계값(Threshold)을 조정하여 최종 출력의 균형을 맞춘다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
- 과도한 편향 보정은 모델의 전반적인 정확도(Accuracy)를 떨어뜨릴 수 있다. '정확도와 공정성 사이의 트레이드오프'를 비즈니스 가치에 맞게 합의하는 의사결정이 기술보다 더 중요하다.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: [[AI-Ethics]] , [[Bias-Variance-Tradeoff]]
|
||||
- Strategy: [[Reliability_Safety_First]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-BIAS-VAR
|
||||
category: "[[10_Wiki/💡 Topics/AI]]"
|
||||
confidence_score: 1.0
|
||||
tags: [Bias Variance Tradeoff, Overfitting, Underfitting, Machine Learning]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Bias-Variance-Tradeoff]] (편향-분산 트레이드오프)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "너무 단순해도, 너무 복잡해도 망한다." 모델이 데이터를 너무 대충 배워 생기는 오차(Bias)와, 너무 깐깐하게 배워 생기는 오차(Variance) 사이의 황금 밸런스를 찾는 머신러닝의 숙명적 과제다.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **High Bias (Underfitting)**:
|
||||
- 모델이 너무 단순하여 데이터의 본질적 패턴을 잡지 못함. (예: 곡선을 직선으로 설명하려 할 때)
|
||||
- **High Variance (Overfitting)**:
|
||||
- 모델이 너무 복잡하여 데이터의 노이즈까지 다 외워버림. 새로운 데이터를 넣으면 엉뚱한 결과가 나옴.
|
||||
- **Total Error Reduction**:
|
||||
- 편향과 분산의 합이 최소가 되는 지점이 바로 모델의 일반화 성능(Generalization)이 가장 높은 구간이다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
- 최근의 초거대 모델(LLM)들은 'Double Descent' 현상에 의해, 모델을 극한으로 키우면 오히려 분산이 다시 줄어들며 성능이 좋아지는 기이한 현상이 발견되고 있다. 이는 전통적인 트레이드오프 이론을 재정립하게 만들고 있다.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: [[Regularization-Techniques]] , [[Model-Optimization-Strategies]]
|
||||
- Foundation: [[Computational Theory & Math/Information Theory]]
|
||||
@@ -0,0 +1,27 @@
|
||||
---
|
||||
id: P-REINFORCE-AI-BDD
|
||||
category: "[[10_Wiki/💡 Topics/Design & Experience]]"
|
||||
confidence_score: 0.98
|
||||
tags: [BDD, Behavior Driven Development, TDD, Agile, Gherkin]
|
||||
last_reinforced: 2026-04-20
|
||||
---
|
||||
|
||||
# [[Behavior-Driven-Development-(BDD)]] (행동 중심 개발)
|
||||
|
||||
## 📌 한 줄 통찰 (The Karpathy Summary)
|
||||
> "코딩하기 전에 대화부터 하라." 기획자, 디자이너, 개발자가 모여 사용자의 행동 시나리오(Given/When/Then)를 명확히 정의하고, 이를 검증하는 테스트 코드를 먼저 작성하며 개발하는 협업 중심 방법론이다.
|
||||
|
||||
## 📖 구조화된 지식 (Synthesized Content)
|
||||
- **Ubiquitous Language**:
|
||||
- 비즈니스 언어와 코드 언어의 간극을 줄이기 위해 누구나 이해할 수 있는 자연어 기반의 시나리오를 사용한다(예: Gherkin 문법).
|
||||
- **Executive Documentation**:
|
||||
- 작성된 테스트 시나리오는 그대로 시스템의 최신 사양서(Living Documentation)가 되어 문서 관리의 고통을 덜어준다.
|
||||
- **User-Centric**:
|
||||
- '어떻게 구현할까'보다 '사용자가 무엇을 얻을까'에 집중하게 하여, 엉뚱한 기능을 만드는 리스크를 원천 차단한다.
|
||||
|
||||
## ⚠️ 모순 및 업데이트 (RL Update)
|
||||
- BDD는 초기 시나리오 작성에 시간이 많이 든다. 하지만 개발 중반 이후 발생하는 '기획 번복'과 '커뮤니케이션 미스'로 인한 손실을 생각하면, 장기적으로는 반드시 이득이 남는 고수익 투자다.
|
||||
|
||||
## 🔗 지식 연결 (Graph)
|
||||
- Related: [[Test-Driven-Development-(TDD)]] , [[Agile-Software-Development]]
|
||||
- Strategy: [[User-Experience-Design]]
|
||||
Reference in New Issue
Block a user