[P-Reinforce] Substantial content added to AI/Math/Economics (Count: 2,166)

This commit is contained in:
2026-04-20 16:42:54 +09:00
parent 0b0ad6a97b
commit 577f2d51e4
14 changed files with 158 additions and 157 deletions
+1 -1
View File
@@ -17,6 +17,6 @@
"repelStrength": 10,
"linkStrength": 1,
"linkDistance": 250,
"scale": 0.2292013594174924,
"scale": 0.08317427835927518,
"close": false
}
+3 -2
View File
@@ -13,12 +13,12 @@
"state": {
"type": "markdown",
"state": {
"file": "00_Raw/2026-04-20/API 응답 모델링 및 상태 머신(State Machine) 설계.md",
"file": "00_Raw/2026-04-20/Diffusion-Models.md",
"mode": "source",
"source": false
},
"icon": "lucide-file",
"title": "API 응답 모델링 및 상태 머신(State Machine) 설계"
"title": "Diffusion-Models"
}
}
]
@@ -182,6 +182,7 @@
},
"active": "5e19c94f304a33d1",
"lastOpenFiles": [
"00_Raw/2026-04-20/Diffusion-Models.md",
"00_Raw/2026-04-20/API 응답 모델링 및 상태 머신(State Machine) 설계.md",
"00_Raw/2026-04-20",
"00_Raw",
+15 -13
View File
@@ -1,25 +1,27 @@
---
id: P-REINFORCE-AUTO-1151FA
id: P-REINFORCE-AI-ABTEST
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.96
tags: [A/B Testing, Statistics, Experiment, Growth Hacking]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - A_B-Testing-Platforms"
---
# [[A_B-Testing-Platforms]]
# [[A_B-Testing-Platforms]] (A/B 테스트 및 실험 설계)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> "내 생각엔 이게 좋다"는 주관성을 버리고, "사용자는 실제로 이렇게 반응한다"를 통계적으로 증명하는 마케팅과 엔지니어링의 결합체다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Hypothesis Testing (가설 검증)**:
- "버튼 색상을 파란색에서 빨간색으로 바꾸면 클릭률(CTR)이 10% 오를 것이다"라는 명확한 가설을 세우고 실험군(A)과 대조군(B)으로 트래픽을 분할한다.
- **Statistical Significance (p-value)**:
- 실험 결과가 '우연'에 의한 것인지 아니면 '의도된 변화'인지 판별한다. 보통 p-value < 0.05를 기준으로 유의미함을 결정한다.
- **Multi-armed Bandit (MAB)**:
- 실험 중간에 성적이 좋은 쪽에 트래픽을 실시간으로 더 배분하여 '실험 비용'을 최소화하고 '수익'을 극대화하는 고도화된 타겟팅 알고리즘.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 한 번에 너무 많은 변수를 바꾸는 것은 금물이다(Simpsons Paradox). 오직 하나의 변인만 통제하여 결과의 인과관계를 명확히 해야 한다. 또한 장기적 영향(Late Arrival Bias)을 고려하여 최소 일주일 이상의 실험 기간을 확보하라.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/A_B-Testing-Platforms.md]]
---
- Related: [[Behavioral-Economics]] , [[Nudge Theory]]
- Implementation: [[React_State_Management_Strategy]]
+15 -13
View File
@@ -1,25 +1,27 @@
---
id: P-REINFORCE-AUTO-79D258
id: P-REINFORCE-AI-AUTOTEST
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.97
tags: [Automated Testing, Game QA, AI Testing, Bot Testing]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Automated-Game-Testing"
---
# [[Automated-Game-Testing]]
# [[Automated-Game-Testing]] (지능형 게임 테스트 자동화)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> QA는 단순히 버그를 찾는 행위를 넘어, AI 에이전트가 게이머처럼 플레이하게 함으로써 게임의 '밸런스'와 '재미의 영역'까지 검증하는 기술이다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Bot-driven Testing**:
- 단순 매크로가 아닌, 강화학습된 AI 봇을 투입하여 맵의 갈 수 없는 곳(Collision Error)을 찾거나 무한 루프에 빠지는 구간을 전수 조사한다.
- **Performance Profiling Automation**:
- 대규모 전투나 복잡한 지형에서 프레임드랍(FPS Drop)이 발생하는 구간을 자동 감지하고, 해당 시점의 메모리 스택과 렌더링 부하를 기록하여 개발팀에 보고한다.
- **Regression Guard**:
- 기능 추가 시 기존의 퀘스트 라인이나 밸런스가 무너지지 않았는지, 자동화된 시나리오 테스트를 통해 24시간 감시 체계를 유지한다.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 자동화 봇은 효율적이지만 '인간의 감정'을 느끼지 못한다. 버그는 없으나 재미가 없는 구역(Boring Zones)을 찾아내는 것은 여전히 인간 QA의 영역이며, AI는 이를 보조하는 증폭기로 사용되어야 한다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Automated-Game-Testing.md]]
---
- Related: [[Software Reliability]] , [[System_Debugging_Protocol]]
- Foundation: [[Reinforcement Learning]]
+16 -13
View File
@@ -1,25 +1,28 @@
---
id: P-REINFORCE-AUTO-77D78F
id: P-REINFORCE-AI-GENMAP
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.99
tags: [PCG, Map Generation, Algorithm, Noise Nature]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Automated-Map-Generation"
---
# [[Automated-Map-Generation]]
# [[Automated-Map-Generation]] (절차적 맵 생성 PCG)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> 무한한 우주는 수학 공식(Seed) 하나에서 탄생한다. 절차적 생성(PCG)은 개발자의 노동력을 '규칙의 창조'로 전이시켜 콘텐츠의 무한 확장을 가능케 한다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Perlin Noise & Simplex Noise**:
- 자연스러운 지형(산, 계곡, 해안선)을 만들기 위한 수학적 노이즈 알고리즘. 연속성을 가진 난수를 통해 자연의 불규칙성을 모사한다.
- **Constraint-based Generation (제약 기반 생성)**:
- 단순히 무작위로 만드는 것이 아니라, "마을은 물 근처에 있어야 한다", "보스 방은 입구에서 가장 멀어야 한다"는 비즈니스 로직(제약 조건)을 알고리즘에 주입한다.
- **Dungeon Generation (BSP, WFC)**:
- **BSP (Binary Space Partitioning)**: 공간을 이진 분할하여 방과 복도를 배치하는 정석적인 방식.
- **WFC (Wave Function Collapse)**: 인접한 타일 간의 관계성을 기반으로 복잡한 구조를 확률적으로 붕괴시켜 완성하는 최신 알고리즘.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- PCG는 자칫 '반복적이고 지루한(Samey)' 느낌을 줄 수 있다. 이를 방지하기 위해 핵심 랜드마크는 수동 제작(Manual Polish)하고, 그 사이의 연결을 PCG가 담당하는 하이브리드 방식이 선호된다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Automated-Map-Generation.md]]
---
- Related: [[Systemic_Simulation_Principles]] , [[Art_Direction_Governance]]
- Foundation: [[Information Theory]]
+15 -13
View File
@@ -1,25 +1,27 @@
---
id: P-REINFORCE-AUTO-3A9338
id: P-REINFORCE-AI-REASON
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.95
tags: [Automated Reasoning, Logic, Inference, Knowledge Graph]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Automated-Reasoning"
---
# [[Automated-Reasoning]]
# [[Automated-Reasoning]] (자동 추론)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> 단순한 '확률적 답변'을 넘어, 수학과 논리의 규칙에 따라 결론을 도출하는 기계의 사고방식이다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Symbolic AI (기호론적 AI)**:
- 데이터를 처리하는 신경망과 달리, 기호와 논리 법칙(If-Then)을 사용하여 참과 거짓을 판별하고 새로운 명제를 이끌어낸다.
- **Inference Engine (추론 엔진)**:
- 지식 베이스(Knowledge Base)에 저장된 사실들을 바탕으로 사용자의 질문에 대한 답을 찾아가는 핵심 모듈. 순방향(Forward) 및 역방향(Backward) 추론 기법이 존재한다.
- **SAT Solvers**:
- 주어진 불리언 공식이 참이 될 수 있는지 판별하는 고도로 최적화된 알고리즘. 복잡한 스케줄링, 베리피케이션, 하드웨어 설계 검증에 필수적으로 사용된다.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 최근에는 기호론적 추론과 딥러닝을 결합한 **Neuro-Symbolic AI**가 주목받고 있다. 딥러닝의 패턴 인식 능력과 기호론의 명확한 논리 구조를 결합하여 '설명 가능한 AI(XAI)'를 구축하는 것이 핵심 목표다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Automated-Reasoning.md]]
---
- Related: [[Automated-Theorem-Proving]] , [[Distributed-Systems-Engineering]]
- Context: [[Information Theory]]
+15 -13
View File
@@ -1,25 +1,27 @@
---
id: P-REINFORCE-AUTO-051F56
id: P-REINFORCE-AI-REFACT
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.96
tags: [Refactoring, Static Analysis, AI Code, Technical Debt]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Automated-Refactoring-Tools"
---
# [[Automated-Refactoring-Tools]]
# [[Automated-Refactoring-Tools]] (자동 리팩토링 도구)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> 코드는 생명체와 같아서 방치하면 썩는다. 자동 리팩토링 도구는 코드의 악취를 맡고 실시간으로 해독제를 주입하는 '시스템의 면역계'다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Static Analysis (정적 분석)**:
- 코드를 실행하지 않고도 잠재적 버그, 중복 코드, 매직 넘버 등을 찾아내어 표준화된 스타일(Lint)로 교정한다.
- **AI-Powered Code Assistant (Copilot, Cursor)**:
- LLM을 활용하여 단순한 린트를 넘어, 함수의 복잡도를 낮추거나 비효율적인 루프를 고성능 패턴으로 바꾸는 지능적 제안을 수행한다.
- **Code Transformation Engines**:
- 대규모 프레임워크 업데이트(예: React 17 -> 18) 시 전체 코드 베이스를 기계적으로 변환하여 인간의 실수를 줄이고 마이그레이션 비용을 획기적으로 낮춘다 (e.g., CodeMods).
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 자동화 도구에 100% 의존하는 것은 위험하다. 비즈니스 맥락(Business Context)을 모르는 기계적 리팩토링은 때로 의도된 우회 코드를 파괴할 수 있다. 최종 검사(Human-in-the-loop)는 여전히 필수적인 관문이다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Automated-Refactoring-Tools.md]]
---
- Related: [[React_Clean_Code_Best_Practices]] , [[Software Reliability]]
- Foundation: [[System_Debugging_Protocol]]
+15 -13
View File
@@ -1,25 +1,27 @@
---
id: P-REINFORCE-AUTO-ABEDDE
id: P-REINFORCE-AI-THEOREM
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.94
tags: [Theorem Proving, Coq, Lean, Formal Verification]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Automated-Theorem-Proving"
---
# [[Automated-Theorem-Proving]]
# [[Automated-Theorem-Proving]] (자동 정기 증명 ATP)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> "코드가 맞다"고 믿는 것이 아니라, 수학적으로 "틀릴 수 없음"을 컴퓨터가 강제로 증명하게 만드는 소프트웨어 신뢰성의 정점이다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Hilbert's Program & Decidability**:
- 모든 수학적 명제를 기계적으로 판별할 수 있는지에 대한 질문에서 시작되었다. 비록 불완전성 정리에 의해 한계가 밝혀졌으나, 특정 영역에서의 자동 증명은 비약적으로 발전했다.
- **Formal Verification (형식 검증)**:
- 운영체제 커널(seL4)이나 금융 스마트 컨트랙트처럼 단 하나의 버그도 허용되지 않는 곳에서, 프로그램이 사양(Specification)대로 동작함을 논리적으로 입증한다.
- **Lean & Coq (Proof Assistants)**:
- 최근 AI(LLM)와 결합하여 인간이 수학 문제를 풀 듯 증명 과정을 생성하고 검증하는 '대화형 증명 도우미'가 대세다.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- ATP는 엄청난 계산 자원을 소모하는 '탐색 문제'다. 모든 경로를 다 뒤지는 대신, 최근에는 신경망이 증명 전략(Tactics)을 제안하고 ATP가 이를 검증하는 하이브리드 방식이 각광받고 있다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Automated-Theorem-Proving.md]]
---
- Related: [[Automated-Reasoning]] , [[Amazon-AWS-Formal-Verification]]
- Foundation: [[Computational Thinking]]
-25
View File
@@ -1,25 +0,0 @@
---
id: P-REINFORCE-AUTO-831796
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Autonomous Vehicle Path Planning"
---
# [[Autonomous Vehicle Path Planning]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Autonomous Vehicle Path Planning.md]]
---
+15 -13
View File
@@ -1,25 +1,27 @@
---
id: P-REINFORCE-AUTO-405EC6
id: P-REINFORCE-AI-PATHPLAN
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.98
tags: [Path Planning, A* Algorithm, Robotics, Autonomous Vehicle]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Autonomous-Vehicle-Path-Planning"
---
# [[Autonomous-Vehicle-Path-Planning]]
# [[Autonomous-Vehicle-Path-Planning]] (자율주행 경로 계획)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> 경로 계획은 '가장 빠른 길'을 찾는 것이 아니라, '안전하고 부드러우며 예측 가능한' 움직임을 실시간으로 설계하는 확률적 탐색이다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Global Path Planning**:
- 출발지에서 목적지까지의 거시적인 경로를 설정한다. 고전적인 **A* (A-star)** 알고리즘이나 **Dijkstra** 알고리즘이 지도 데이터 위에서 작동한다.
- **Local Motion Planning (실시간 회피)**:
- 갑자기 튀어나오는 보행자나 장애물을 피하기 위한 미시적인 궤적 최적화. **RRT* (Rapidly-exploring Random Tree)**나 **Hybrid A*** 등이 사용된다.
- **Behavioral Decision (판단 레이어)**:
- 차선 변경, 추월, 일단 정지 등 도로의 법규(Traffic Laws)와 에티켓을 반영한 의사결정 알고리즘과 물리적 제어를 결합한다.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 과거에는 규칙 기반(Rule-based) 알고리즘이 주류였으나, 최근에는 복잡한 도심 상황을 해결하기 위해 'End-to-End' 딥러닝 방식과 '전통적 플래닝'을 결합한 계층적 구조가 표준으로 자리 잡았다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Autonomous-Vehicle-Path-Planning.md]]
---
- Related: [[Systemic_Simulation_Principles]] , [[Robotic Manipulation]]
- Context: [[Digital Twins]]
+17 -13
View File
@@ -1,25 +1,29 @@
---
id: P-REINFORCE-AUTO-5875AD
id: P-REINFORCE-AI-BAYES
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.99
tags: [Bayesian Inference, Probability, Thinking, Logic]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Bayesian Inference"
---
# [[Bayesian Inference]]
# [[Bayesian-Inference]] (베이지안 추론)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> 세상은 확실한 답변(P=0 or 1)이 아니라 '확률적 믿음'으로 가득 차 있으며, 새로운 증거가 나타날 때마다 그 믿음의 확률을 끊임없이 수정(Update)하는 것이 진정한 지능이다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Prior, Likelihood, Posterior**:
- **Prior (사전 확률)**: 사건이 발생하기 전의 나의 믿음.
- **Likelihood (우도)**: 만약 내 믿음이 맞다면 이번 결과가 나올 확률.
- **Posterior (사후 확률)**: 결과를 목격하고 난 뒤 수정된 새로운 믿음.
- **베이즈 정리 ($P(A|B) = P(B|A)P(A) / P(B)$)**:
- 관측되지 않은 원인(A)의 확률을 관측된 결과(B)를 통해 추론하는 강력한 수학적 도구.
- **Applications in AI**:
- 스팸 메일 분류(Naive Bayes), 자율주행 센서 퓨전(Kalman Filter), 강화학습의 탐험(Exploration vs Exploitation) 전략의 근간이다.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 전통 통계학(Frequentist)과의 차이점을 이해해야 한다. 베이지안은 '모르는 것'에 대한 주관적 가정을 허용하므로, 데이터가 적은 초기 단계에서 훨씬 강력하지만 부적절한 사전 확률(Prior) 설정은 편향된 결과를 낳을 수 있다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Bayesian Inference.md]]
---
- Related: [[Information Theory]] , [[Common_Sense_Reasoning]]
- Foundation: [[Computational Thinking]]
+15 -13
View File
@@ -1,25 +1,27 @@
---
id: P-REINFORCE-AUTO-9A5386
id: P-REINFORCE-AI-BEHAVE
category: "[[10_Wiki/💡 Topics/AI]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.97
tags: [Behavioral Economics, Human Factor, Nudge, Psychology]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - Behavioral-Economics"
---
# [[Behavioral-Economics]]
# [[Behavioral-Economics]] (행동 경제학)
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> 인간은 합리적이지 않다. 다만 '예측 가능하게 비합리적'일 뿐이다. 이 비합리성의 패턴을 이해하는 것이 최고의 사용자 경험(UX)을 만드는 열쇠다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **Loss Aversion (손실 회피)**:
- 10,000원을 얻었을 때의 기쁨보다 10,000원을 잃었을 때의 고통이 훨씬 크다. 이 기제로 인해 사람들은 변화를 거부하고 형상 유지(Status Quo Bias)를 선호한다.
- **Anchoring Effect (닻 내림 효과)**:
- 처음 제시된 정보(가격 등)가 기준점이 되어 이후 모든 판단에 영향을 준다. 할인 전 가격을 크게 써놓는 상술의 근거다.
- **Nudge (넛지)**:
- 명령이나 금지가 아니라, 선택 설계(Choice Architecture)를 통해 타인의 행동을 부드럽게 유도하는 기술 (예: 소변기의 파리 그림, 디폴트 옵션 설정).
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** AI 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 행동 경제학의 실험들은 최근 '재현성 위기'를 겪고 있다. 특정 실험실 환경에서의 결과가 실제 웹 환경이나 문화권마다 다르게 나타날 수 있음을 인지하고, 항상 자사 서비스에서의 자가 테스트(A/B Test)가 병행되어야 한다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/Behavioral-Economics.md]]
---
- Related: [[Nudge Theory]] , [[A_B-Testing-Platforms]]
- Design: [[Design_Psychology]]
@@ -1,25 +1,29 @@
---
id: P-REINFORCE-AUTO-4BB54E
category: "[[10_Wiki/💡 Topics/Software Architecture]]"
confidence_score: 0.90
tags: [auto-reinforced]
confidence_score: 0.98
tags: [AlphaGo, MCTS, Reinforcement Learning, Simulation, Robotics]
last_reinforced: 2026-04-20
github_commit: "[P-Reinforce] Continuous Worker - AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation"
github_commit: "[P-Reinforce] Substantial content added to AI Simulation Bundle."
---
# [[AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation]]
# [[AlphaGo (Monte Carlo Tree Search + RL)], [Autonomous Driving Simulation], [Robotic Manipulation]]
## 📌 한 줄 통찰 (The Karpathy Summary)
> 지식 요약 정보 추출 중...
> 복잡한 의사결정 문제는 '모든 경우의 수'를 계산하는 것이 아니라, '승리(성공) 가능성이 높은 경로'를 시뮬레이션으로 탐색하고 그 경험을 신경망(RL)에 내재화하는 과정이다.
## 📖 구조화된 지식 (Synthesized Content)
본문 구조화 작업 중...
- **AlphaGo (MCTS + RL)의 정수**:
- **Monte Carlo Tree Search (MCTS)**: 무작위 시뮬레이션을 통해 유망한 수(Node)를 확장하고 통계적으로 최적의 수를 찾는다.
- **Reinforcement Learning (강화 학습)**: 자가 대국(Self-play)을 통해 정책망(Policy Network)과 가치망(Value Network)을 고도화하여, 인간의 기보를 뛰어넘는 직관을 형성한다.
- **자율주행 시뮬레이션 (Autonomous Driving Simulation)**:
- 현실에서의 사고는 치명적이다. 디지털 트윈 환경에서 수백만 마일의 가상 주행을 통해 코너 케이스(Edge Cases)를 학습시키고, 이를 현실 세계의 제어 알고리즘으로 이식(Sim-to-Real)한다.
- **로봇 조작 (Robotic Manipulation)**:
- 물체의 마찰력, 중력, 촉감을 물리 엔진 내에서 물리 법칙으로 구현하고, 강화 학습을 통해 로봇 팔이 정교한 동작을 수행하도록 훈련시킨다.
## ⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요.
- **정책 변화:** Software Architecture 분야의 자동 자산화 수행.
## ⚠️ 모순 및 업데이트 (RL Update)
- 시뮬레이션은 정교할수록 좋지만, 현실과의 괴리인 'Reality Gap'이 항상 존재한다. 이를 해결하기 위해 Domain Randomization(시뮬레이션 환경에 무작위 변동을 주어 강건함을 확보) 기법이 필수적으로 동반되어야 한다.
## 🔗 지식 연결 (Graph)
- Raw Source: [[00_Raw/2026-04-20/AlphaGo (Monte Carlo Tree Search + RL)], [Autonomous Driving Simulation], [Robotic Manipulation.md]]
---
- Related: [[Digital Twins]] , [[Reinforcement Learning]] , [[Systemic_Simulation_Principles]]
- Foundation: [[Information Theory]]