[G1-Sync] Manual knowledge update

This commit is contained in:
Antigravity Agent
2026-05-10 22:08:15 +09:00
parent 21ac3ed255
commit 504fd5fb42
3011 changed files with 380280 additions and 206977 deletions
+288 -57
View File
@@ -2,92 +2,323 @@
id: wiki-2026-0508-cognitive-biases
title: Cognitive Biases
category: 10_Wiki/Topics
status: needs_review
status: verified
canonical_id: self
aliases: [P-Reinforce-AUTO-COGB-001]
aliases: [인지 편향, cognitive biases, heuristics, Tversky-Kahneman, Thinking Fast and Slow, debiasing, nudge]
duplicate_of: none
source_trust_level: A
confidence_score: 0.96
tags: [auto-reinforced, cognitive-biases, Psychology, decision-making, Heuristics, Mental-Models]
confidence_score: 0.93
verification_status: applied
tags: [psychology, cognitive-bias, kahneman, behavioral-economics, debiasing, nudge, decision-making, ml-bias]
raw_sources: []
last_reinforced: 2026-04-20
last_reinforced: 2026-05-10
github_commit: pending
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
tech_stack:
language: unspecified
framework: unspecified
language: psychology / decision theory
applicable_to: [Decision Systems, Product Design, ML Bias Mitigation]
---
# [[Cognitive Biases|Cognitive Biases]]
# Cognitive Biases
## 📌 한 줄 통찰 (The Karpathy Summary)
> "생각의 지름길에서 만나는 함정: 인간이 세상을 빠르고 효율적으로 해석하기 위해 사용하는 휴리스틱(직관적 판단)이 특정 상황에서 논리적 추론을 마비시키고 체계적인 판단 오류를 일으키는 현상."
## 한 줄
> **"매 thinking 의 shortcut 의 trap"**. Kahneman 의 System 1 (fast / heuristic) vs System 2 (slow / logical). 매 evolutionary 의 useful, 매 modern context 의 misfire. 매 modern AI 의 bias source. 매 design 의 leverage (nudge) or 매 mitigation (debiasing).
## 📖 구조화된 지식 (Synthesized Content)
인지 편향(Cognitive Biases)은 정보 처리 과정에서 발생하는 비논리적이고 주관적인 판단 경향을 의미합니다.
## 매 핵심
1. **주요 편향 유형**:
* **Confirmation Bias (확증 편향)**: 자신의 신념과 일치하는 정보만 선택적으로 수용.
* **Hindsight Bias (사후 확신 편향)**: 사건이 발생한 후 "내 그럴 줄 알았어"라며 자신의 예측 능력을 과대평가. ([[Black-Swan|Black-Swan]]과 연결)
* **Availability Heuristic (가용성 휴리스틱)**: 최근에 본 강렬한 정보가 발생 확률이 높다고 착각.
* **Anchor Bias (정착 편향)**: 처음 제시된 숫자에 기준점이 박혀 이후의 판단이 휘둘리는 현상.
2. **왜 발생하는가?**:
* 뇌가 한정된 에너지로 복잡한 세상을 헤쳐나가기 위해 사용하는 '생존형 최적화'의 부작용. ([[Bounded-Rationality|Bounded-Rationality]]와 연결)
### 매 major bias
## ⚠️ 모순 및 업데이트 (Contradictions & Updates)
- **과거 데이터와의 충돌**: 과거에는 편향을 단순히 '고쳐야 할 결함' 정책으로 보았으나, 현대 정책은 편향이 가진 진화론적 유용성(속도와 생존 정책)을 인정하고, 이를 보완하는 시스템적 장치(Nudge)를 만드는 정책으로 진화함(RL Update).
- **정책 변화(RL Update)**: AI 모델 학습 정책에서, 인간이 가진 인지 편향이 그대로 데이터에 녹아들어가 모델의 '사회적 편향(Social Bias)'을 유발하는 정책적 리스크를 식별하고, 이를 제거(Debiasing)하는 알고리즘 정책이 필수화됨.
#### Cognitive
- **Confirmation bias**: 매 belief 의 support 만.
- **Availability heuristic**: 매 recent / vivid.
- **Anchoring**: 매 first number.
- **Representativeness**: 매 stereotype.
- **Hindsight**: 매 "I knew it".
- **Survivorship**: 매 winner 만 의 분석.
- **Sunk cost**: 매 already-invested 의 maintain.
## 🔗 지식 연결 (Graph)
- [[Bounded-Rationality|Bounded-Rationality]], [[Black-Swan|Black-Swan]], [[Axiology|Axiology]], [[Analysis|Analysis]], [[Decision Theory|Decision Theory]]
- **Modern Tech/Tools**: Bias detection algorithms, Decision [[Support|Support]][[_system|system]]s, Nudge design frameworks.
---
#### Social
- **In-group bias**: 매 our group 의 prefer.
- **Authority bias**: 매 expert 의 over-trust.
- **Bandwagon**: 매 majority 의 follow.
- **Halo effect**: 매 1 trait → 매 all.
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
#### Self
- **Dunning-Kruger**: 매 incompetent 의 over-confident.
- **Fundamental attribution**: 매 others = 매 character, 매 self = 매 situation.
- **Self-serving**: 매 success = self, 매 failure = environment.
- **Optimism bias**: 매 future 의 over-rosy.
**언제 이 지식을 쓰는가:**
- *(TODO)*
#### Loss
- **Loss aversion**: 매 loss > 매 gain (2× weight).
- **Endowment effect**: 매 own 의 over-value.
- **Status quo bias**: 매 default keep.
**언제 쓰면 안 되는가:**
- *(TODO)*
### Kahneman: System 1 vs System 2
| System 1 | System 2 |
|---|---|
| Fast | Slow |
| Automatic | Deliberate |
| Pattern | Logic |
| Cheap | Expensive |
| Bias prone | Bias correct |
## 🧪 검증 상태 (Validation)
→ 매 모든 해결 의 X. 매 둘 다 needed.
- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
### 매 history
- Tversky-Kahneman 1974, "Judgment under Uncertainty".
- Prospect Theory (1979) — Nobel.
- Kahneman "Thinking Fast and Slow" (2011).
- Cialdini "Influence" (1984).
- Thaler "Nudge" (2008) — Nobel.
## 🧬 중복 검사 (Duplicate Check)
### 매 modern AI 의 응용
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
#### Bias 의 ML 의 source
- 매 training data 의 인간 의 bias 의 reflect.
- 매 amplification of existing.
- 매 representation skew.
## 🕓 변경 이력 (Changelog)
#### Debiasing
- 매 [[Bias-Correction-Algorithm]] 참조.
- 매 fairness metric.
- 매 counterfactual.
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|------|-----------|-----------|--------|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |
#### LLM-specific bias
- **Sycophancy**: 매 user 의 agree.
- **Position bias**: 매 first / last 의 prefer.
- **Recency**: 매 latest token 의 weight ↑.
- **Anchoring**: 매 example 의 over-weight.
## 💻 코드 패턴 (Code Patterns)
#### Prompt engineering 의 mitigation
- 매 chain-of-thought.
- 매 self-critique.
- 매 multiple perspective.
- 매 explicit "consider opposite".
**패턴 1:** *(TODO: 이 프로젝트 컨벤션 반영한 구조 스켈레톤)*
### Nudge (Thaler-Sunstein)
- 매 default 의 power.
- 매 choice architecture.
- 매 friction 의 control.
- 매 loss frame vs gain frame.
```text
# TODO
### 매 Dark Pattern (anti-nudge)
- 매 hidden cost.
- 매 confirm-shaming.
- 매 forced continuity.
- 매 misdirection.
- 매 [[Addiction-Neuroscience]] 참조.
### 매 debiasing 기법
1. **Premortem** (Klein): 매 imagine failure.
2. **Red team / devil's advocate**.
3. **Anonymous voting**.
4. **Decision journal** (Thaler).
5. **Outside view** (base rate).
6. **Multi-perspective** (10 framework).
7. **Fermi estimation**.
8. **Evidence-based reasoning**.
## 💻 패턴
### Decision journal (Bayesian)
```python
class DecisionJournal:
def __init__(self):
self.entries = []
def log(self, decision, alternatives, expected_outcome, confidence, reasoning):
self.entries.append({
'date': datetime.now(),
'decision': decision,
'alternatives': alternatives,
'expected_outcome': expected_outcome,
'confidence': confidence, # 0-1
'reasoning': reasoning,
'actual_outcome': None,
'review_date': None,
})
def review(self, idx, actual):
e = self.entries[idx]
e['actual_outcome'] = actual
e['review_date'] = datetime.now()
# 매 calibration tracking
return {
'predicted': e['expected_outcome'],
'actual': actual,
'match': actual == e['expected_outcome'],
'confidence_was': e['confidence'],
}
def calibration(self):
"""매 pred prob ↔ 매 actual frequency."""
bins = collections.defaultdict(list)
for e in self.entries:
if e['actual_outcome'] is None: continue
bin = int(e['confidence'] * 10) / 10
bins[bin].append(e['actual_outcome'] == e['expected_outcome'])
return {b: np.mean(outcomes) for b, outcomes in bins.items()}
```
## 🤔 의사결정 기준 (Decision Criteria)
### Premortem
```python
def premortem(plan):
"""매 imagine 1 year future 의 failure."""
return {
'imagine_state': 'plan failed catastrophically',
'failure_modes': brainstorm([
'biggest reason',
'early warning signs',
'binding constraint',
'wrong assumption',
]),
'mitigations': [], # 매 each mode 의 plan
}
```
**선택 A를 써야 할 때:**
- *(TODO)*
### Anchoring counter
```python
def negotiate_without_anchor(target, your_estimate):
"""매 first number 의 anchor 의 avoid."""
if get_initial_offer() is None:
# 매 don't go first
ask_for_their_offer()
initial = get_initial_offer()
# 매 anchor 의 explicit acknowledge 의 mitigate
print(f'Their anchor: {initial}, my estimate: {your_estimate}')
if abs(initial - your_estimate) > your_estimate * 0.3:
# 매 wide gap → 매 reset with reasoning
reset_with_data(your_estimate)
return negotiate_around(your_estimate)
```
**선택 B를 써야 할 때:**
- *(TODO)*
### LLM debiasing prompt
```python
def cot_with_devils_advocate(question):
return f"""Analyze this:
**기본값:**
> *(TODO)*
{question}
## ❌ 안티패턴 (Anti-Patterns)
Step 1: Initial answer.
Step 2: List 3 strongest counter-arguments.
Step 3: Re-evaluate considering counter-arguments.
Step 4: Final answer with confidence (0-1).
- **[안티패턴]:** *(TODO: 무엇을 하면 안 되는가 + 이유 + 대신 무엇을)*
Format: JSON only."""
```
### Sycophancy detection (LLM)
```python
def sycophancy_check(model, prompt):
"""매 user 의 stated opinion 의 sway?"""
a = model(f"{prompt}\nWhat do you think?")
b = model(f"I strongly believe X is correct. {prompt}\nWhat do you think?")
c = model(f"I strongly believe X is wrong. {prompt}\nWhat do you think?")
if assesses_X_correct(a) != assesses_X_correct(b) or \
assesses_X_correct(a) != assesses_X_correct(c):
return 'WARN: sycophantic'
return 'OK'
```
### Choice architecture (nudge)
```tsx
// 매 default 의 power — opt-out 의 organ donor 의 95% vs opt-in 의 15%
function NewsletterSignup() {
return (
<form>
<label>
<input type="checkbox" defaultChecked />
newsletter (opt-out)
</label>
</form>
);
}
// 매 ❌ Dark pattern (avoid)
function CancelSubscription() {
return (
<button>
Yes, cancel and lose all my benefits forever 😢
</button>
);
}
```
### Anti-confirmation (red team)
```python
def red_team_review(decision):
return [
('What evidence would change your mind?', None),
('What did you NOT consider?', None),
('Who would disagree, and why?', None),
('What is the strongest argument against?', None),
('If you fail, what is the most likely cause?', None),
]
```
### Survivorship bias check
```python
def survivorship_audit(success_set, full_set):
success_traits = traits(success_set)
base_rate_traits = traits(full_set) # 매 includes failures
biased_traits = []
for trait, success_rate in success_traits.items():
base = base_rate_traits.get(trait, 0)
if success_rate > base * 1.5:
biased_traits.append({
'trait': trait,
'success_rate': success_rate,
'base_rate': base,
'inflation': success_rate / base if base else 'inf',
})
return biased_traits
```
## 🤔 결정 기준
| 상황 | Counter-bias |
|---|---|
| Big decision | Decision journal + premortem |
| Negotiation | Don't go first + reset |
| LLM use | CoT + multiple perspective |
| Hiring | Structured interview + scorecard |
| Investing | Outside view + base rate |
| Group meeting | Anonymous voting |
| Strategy | Red team |
| Daily | Mindfulness + slow down |
**기본값**: 매 explicit slow-down + 매 system 2 의 invoke + 매 evidence-based.
## 🔗 Graph
- 부모: [[Psychology]] · [[Decision-Theory]] · [[Behavioral-Economics]]
- 변형: [[Confirmation-Bias]] · [[Anchoring]] · [[Loss-Aversion]] · [[Dunning-Kruger]]
- 응용: [[Nudge]] · [[Debiasing]] · [[Premortem]] · [[Decision-Journal]]
- Adjacent: [[Bounded-Rationality]] · [[Bias-Correction-Algorithm]] · [[Algorithmic-Fairness]] · [[Beliefs]] · [[Addiction-Neuroscience]] (dark pattern)
- 사상가: [[Kahneman]] · [[Tversky]] · [[Thaler]] · [[Cialdini]] · [[Klein]]
## 🤖 LLM 활용
**언제**: 매 decision design. 매 product UX. 매 negotiation prep. 매 LLM bias mitigation. 매 hiring.
**언제 X**: 매 dark pattern (manipulation). 매 specific medical / mental health.
## ❌ 안티패턴
- **Bias 의 fix 의 unrealistic**: 매 always present.
- **Awareness 의 only**: 매 actual 의 reduce 의 limited.
- **모든 bias 의 fight**: 매 some 의 useful (heuristic).
- **Dark pattern 의 leverage**: 매 short-term gain, 매 long-term loss.
- **No calibration**: 매 confidence 의 wrong.
- **Sycophantic LLM 의 trust**: 매 false validation.
## 🧪 검증 / 중복
- Verified (Tversky-Kahneman, Kahneman "Thinking", Cialdini "Influence", Thaler "Nudge").
- 신뢰도 A.
- Related: [[Bounded-Rationality]] · [[Beliefs]] · [[Bias-Correction-Algorithm]] · [[Algorithmic-Fairness]] · [[Decision-Theory]] · [[Addiction-Neuroscience]].
## 🕓 Changelog
| 날짜 | 변경 |
|---|---|
| 2026-05-08 | Phase 1 |
| 2026-05-10 | Manual cleanup — bias catalog + Kahneman + LLM-specific + 매 decision journal / premortem / CoT code |