From 577f2d51e4f0c7d329d329c1dc86f3f8642bdb11 Mon Sep 17 00:00:00 2001 From: yesung Date: Mon, 20 Apr 2026 16:42:54 +0900 Subject: [PATCH] [P-Reinforce] Substantial content added to AI/Math/Economics (Count: 2,166) --- .obsidian/graph.json | 2 +- .obsidian/workspace.json | 5 ++-- 00_Raw/2026-04-20/Diffusion-Models.md | 0 AI/A_B-Testing-Platforms.md | 28 +++++++++-------- AI/Automated-Game-Testing.md | 28 +++++++++-------- AI/Automated-Map-Generation.md | 29 ++++++++++-------- AI/Automated-Reasoning.md | 28 +++++++++-------- AI/Automated-Refactoring-Tools.md | 28 +++++++++-------- AI/Automated-Theorem-Proving.md | 28 +++++++++-------- AI/Autonomous Vehicle Path Planning.md | 25 ---------------- AI/Autonomous-Vehicle-Path-Planning.md | 28 +++++++++-------- AI/Bayesian Inference.md | 30 +++++++++++-------- AI/Behavioral-Economics.md | 28 +++++++++-------- ...iving Simulation] [Robotic Manipulation.md | 28 +++++++++-------- 14 files changed, 158 insertions(+), 157 deletions(-) create mode 100644 00_Raw/2026-04-20/Diffusion-Models.md delete mode 100644 AI/Autonomous Vehicle Path Planning.md diff --git a/.obsidian/graph.json b/.obsidian/graph.json index 81f743d5..0f734889 100644 --- a/.obsidian/graph.json +++ b/.obsidian/graph.json @@ -17,6 +17,6 @@ "repelStrength": 10, "linkStrength": 1, "linkDistance": 250, - "scale": 0.2292013594174924, + "scale": 0.08317427835927518, "close": false } \ No newline at end of file diff --git a/.obsidian/workspace.json b/.obsidian/workspace.json index 63942912..d4ce3cbf 100644 --- a/.obsidian/workspace.json +++ b/.obsidian/workspace.json @@ -13,12 +13,12 @@ "state": { "type": "markdown", "state": { - "file": "00_Raw/2026-04-20/API 응답 모델링 및 상태 머신(State Machine) 설계.md", + "file": "00_Raw/2026-04-20/Diffusion-Models.md", "mode": "source", "source": false }, "icon": "lucide-file", - "title": "API 응답 모델링 및 상태 머신(State Machine) 설계" + "title": "Diffusion-Models" } } ] @@ -182,6 +182,7 @@ }, "active": "5e19c94f304a33d1", "lastOpenFiles": [ + "00_Raw/2026-04-20/Diffusion-Models.md", "00_Raw/2026-04-20/API 응답 모델링 및 상태 머신(State Machine) 설계.md", "00_Raw/2026-04-20", "00_Raw", diff --git a/00_Raw/2026-04-20/Diffusion-Models.md b/00_Raw/2026-04-20/Diffusion-Models.md new file mode 100644 index 00000000..e69de29b diff --git a/AI/A_B-Testing-Platforms.md b/AI/A_B-Testing-Platforms.md index c3d56332..5a80c519 100644 --- a/AI/A_B-Testing-Platforms.md +++ b/AI/A_B-Testing-Platforms.md @@ -1,25 +1,27 @@ --- -id: P-REINFORCE-AUTO-1151FA +id: P-REINFORCE-AI-ABTEST category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.96 +tags: [A/B Testing, Statistics, Experiment, Growth Hacking] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - A_B-Testing-Platforms" --- -# [[A_B-Testing-Platforms]] +# [[A_B-Testing-Platforms]] (A/B 테스트 및 실험 설계) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> "내 생각엔 이게 좋다"는 주관성을 버리고, "사용자는 실제로 이렇게 반응한다"를 통계적으로 증명하는 마케팅과 엔지니어링의 결합체다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Hypothesis Testing (가설 검증)**: + - "버튼 색상을 파란색에서 빨간색으로 바꾸면 클릭률(CTR)이 10% 오를 것이다"라는 명확한 가설을 세우고 실험군(A)과 대조군(B)으로 트래픽을 분할한다. +- **Statistical Significance (p-value)**: + - 실험 결과가 '우연'에 의한 것인지 아니면 '의도된 변화'인지 판별한다. 보통 p-value < 0.05를 기준으로 유의미함을 결정한다. +- **Multi-armed Bandit (MAB)**: + - 실험 중간에 성적이 좋은 쪽에 트래픽을 실시간으로 더 배분하여 '실험 비용'을 최소화하고 '수익'을 극대화하는 고도화된 타겟팅 알고리즘. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 한 번에 너무 많은 변수를 바꾸는 것은 금물이다(Simpsons Paradox). 오직 하나의 변인만 통제하여 결과의 인과관계를 명확히 해야 한다. 또한 장기적 영향(Late Arrival Bias)을 고려하여 최소 일주일 이상의 실험 기간을 확보하라. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/A_B-Testing-Platforms.md]] ---- +- Related: [[Behavioral-Economics]] , [[Nudge Theory]] +- Implementation: [[React_State_Management_Strategy]] diff --git a/AI/Automated-Game-Testing.md b/AI/Automated-Game-Testing.md index 2e3e012c..cc03b3f8 100644 --- a/AI/Automated-Game-Testing.md +++ b/AI/Automated-Game-Testing.md @@ -1,25 +1,27 @@ --- -id: P-REINFORCE-AUTO-79D258 +id: P-REINFORCE-AI-AUTOTEST category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.97 +tags: [Automated Testing, Game QA, AI Testing, Bot Testing] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Automated-Game-Testing" --- -# [[Automated-Game-Testing]] +# [[Automated-Game-Testing]] (지능형 게임 테스트 자동화) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> QA는 단순히 버그를 찾는 행위를 넘어, AI 에이전트가 게이머처럼 플레이하게 함으로써 게임의 '밸런스'와 '재미의 영역'까지 검증하는 기술이다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Bot-driven Testing**: + - 단순 매크로가 아닌, 강화학습된 AI 봇을 투입하여 맵의 갈 수 없는 곳(Collision Error)을 찾거나 무한 루프에 빠지는 구간을 전수 조사한다. +- **Performance Profiling Automation**: + - 대규모 전투나 복잡한 지형에서 프레임드랍(FPS Drop)이 발생하는 구간을 자동 감지하고, 해당 시점의 메모리 스택과 렌더링 부하를 기록하여 개발팀에 보고한다. +- **Regression Guard**: + - 기능 추가 시 기존의 퀘스트 라인이나 밸런스가 무너지지 않았는지, 자동화된 시나리오 테스트를 통해 24시간 감시 체계를 유지한다. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 자동화 봇은 효율적이지만 '인간의 감정'을 느끼지 못한다. 버그는 없으나 재미가 없는 구역(Boring Zones)을 찾아내는 것은 여전히 인간 QA의 영역이며, AI는 이를 보조하는 증폭기로 사용되어야 한다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Automated-Game-Testing.md]] ---- +- Related: [[Software Reliability]] , [[System_Debugging_Protocol]] +- Foundation: [[Reinforcement Learning]] diff --git a/AI/Automated-Map-Generation.md b/AI/Automated-Map-Generation.md index 11073524..19852240 100644 --- a/AI/Automated-Map-Generation.md +++ b/AI/Automated-Map-Generation.md @@ -1,25 +1,28 @@ --- -id: P-REINFORCE-AUTO-77D78F +id: P-REINFORCE-AI-GENMAP category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.99 +tags: [PCG, Map Generation, Algorithm, Noise Nature] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Automated-Map-Generation" --- -# [[Automated-Map-Generation]] +# [[Automated-Map-Generation]] (절차적 맵 생성 PCG) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> 무한한 우주는 수학 공식(Seed) 하나에서 탄생한다. 절차적 생성(PCG)은 개발자의 노동력을 '규칙의 창조'로 전이시켜 콘텐츠의 무한 확장을 가능케 한다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Perlin Noise & Simplex Noise**: + - 자연스러운 지형(산, 계곡, 해안선)을 만들기 위한 수학적 노이즈 알고리즘. 연속성을 가진 난수를 통해 자연의 불규칙성을 모사한다. +- **Constraint-based Generation (제약 기반 생성)**: + - 단순히 무작위로 만드는 것이 아니라, "마을은 물 근처에 있어야 한다", "보스 방은 입구에서 가장 멀어야 한다"는 비즈니스 로직(제약 조건)을 알고리즘에 주입한다. +- **Dungeon Generation (BSP, WFC)**: + - **BSP (Binary Space Partitioning)**: 공간을 이진 분할하여 방과 복도를 배치하는 정석적인 방식. + - **WFC (Wave Function Collapse)**: 인접한 타일 간의 관계성을 기반으로 복잡한 구조를 확률적으로 붕괴시켜 완성하는 최신 알고리즘. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- PCG는 자칫 '반복적이고 지루한(Samey)' 느낌을 줄 수 있다. 이를 방지하기 위해 핵심 랜드마크는 수동 제작(Manual Polish)하고, 그 사이의 연결을 PCG가 담당하는 하이브리드 방식이 선호된다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Automated-Map-Generation.md]] ---- +- Related: [[Systemic_Simulation_Principles]] , [[Art_Direction_Governance]] +- Foundation: [[Information Theory]] diff --git a/AI/Automated-Reasoning.md b/AI/Automated-Reasoning.md index dac71956..48fa0f6b 100644 --- a/AI/Automated-Reasoning.md +++ b/AI/Automated-Reasoning.md @@ -1,25 +1,27 @@ --- -id: P-REINFORCE-AUTO-3A9338 +id: P-REINFORCE-AI-REASON category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.95 +tags: [Automated Reasoning, Logic, Inference, Knowledge Graph] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Automated-Reasoning" --- -# [[Automated-Reasoning]] +# [[Automated-Reasoning]] (자동 추론) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> 단순한 '확률적 답변'을 넘어, 수학과 논리의 규칙에 따라 결론을 도출하는 기계의 사고방식이다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Symbolic AI (기호론적 AI)**: + - 데이터를 처리하는 신경망과 달리, 기호와 논리 법칙(If-Then)을 사용하여 참과 거짓을 판별하고 새로운 명제를 이끌어낸다. +- **Inference Engine (추론 엔진)**: + - 지식 베이스(Knowledge Base)에 저장된 사실들을 바탕으로 사용자의 질문에 대한 답을 찾아가는 핵심 모듈. 순방향(Forward) 및 역방향(Backward) 추론 기법이 존재한다. +- **SAT Solvers**: + - 주어진 불리언 공식이 참이 될 수 있는지 판별하는 고도로 최적화된 알고리즘. 복잡한 스케줄링, 베리피케이션, 하드웨어 설계 검증에 필수적으로 사용된다. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 최근에는 기호론적 추론과 딥러닝을 결합한 **Neuro-Symbolic AI**가 주목받고 있다. 딥러닝의 패턴 인식 능력과 기호론의 명확한 논리 구조를 결합하여 '설명 가능한 AI(XAI)'를 구축하는 것이 핵심 목표다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Automated-Reasoning.md]] ---- +- Related: [[Automated-Theorem-Proving]] , [[Distributed-Systems-Engineering]] +- Context: [[Information Theory]] diff --git a/AI/Automated-Refactoring-Tools.md b/AI/Automated-Refactoring-Tools.md index 425f29ec..ec4f1887 100644 --- a/AI/Automated-Refactoring-Tools.md +++ b/AI/Automated-Refactoring-Tools.md @@ -1,25 +1,27 @@ --- -id: P-REINFORCE-AUTO-051F56 +id: P-REINFORCE-AI-REFACT category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.96 +tags: [Refactoring, Static Analysis, AI Code, Technical Debt] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Automated-Refactoring-Tools" --- -# [[Automated-Refactoring-Tools]] +# [[Automated-Refactoring-Tools]] (자동 리팩토링 도구) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> 코드는 생명체와 같아서 방치하면 썩는다. 자동 리팩토링 도구는 코드의 악취를 맡고 실시간으로 해독제를 주입하는 '시스템의 면역계'다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Static Analysis (정적 분석)**: + - 코드를 실행하지 않고도 잠재적 버그, 중복 코드, 매직 넘버 등을 찾아내어 표준화된 스타일(Lint)로 교정한다. +- **AI-Powered Code Assistant (Copilot, Cursor)**: + - LLM을 활용하여 단순한 린트를 넘어, 함수의 복잡도를 낮추거나 비효율적인 루프를 고성능 패턴으로 바꾸는 지능적 제안을 수행한다. +- **Code Transformation Engines**: + - 대규모 프레임워크 업데이트(예: React 17 -> 18) 시 전체 코드 베이스를 기계적으로 변환하여 인간의 실수를 줄이고 마이그레이션 비용을 획기적으로 낮춘다 (e.g., CodeMods). -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 자동화 도구에 100% 의존하는 것은 위험하다. 비즈니스 맥락(Business Context)을 모르는 기계적 리팩토링은 때로 의도된 우회 코드를 파괴할 수 있다. 최종 검사(Human-in-the-loop)는 여전히 필수적인 관문이다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Automated-Refactoring-Tools.md]] ---- +- Related: [[React_Clean_Code_Best_Practices]] , [[Software Reliability]] +- Foundation: [[System_Debugging_Protocol]] diff --git a/AI/Automated-Theorem-Proving.md b/AI/Automated-Theorem-Proving.md index ca8044d6..0666aa37 100644 --- a/AI/Automated-Theorem-Proving.md +++ b/AI/Automated-Theorem-Proving.md @@ -1,25 +1,27 @@ --- -id: P-REINFORCE-AUTO-ABEDDE +id: P-REINFORCE-AI-THEOREM category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.94 +tags: [Theorem Proving, Coq, Lean, Formal Verification] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Automated-Theorem-Proving" --- -# [[Automated-Theorem-Proving]] +# [[Automated-Theorem-Proving]] (자동 정기 증명 ATP) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> "코드가 맞다"고 믿는 것이 아니라, 수학적으로 "틀릴 수 없음"을 컴퓨터가 강제로 증명하게 만드는 소프트웨어 신뢰성의 정점이다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Hilbert's Program & Decidability**: + - 모든 수학적 명제를 기계적으로 판별할 수 있는지에 대한 질문에서 시작되었다. 비록 불완전성 정리에 의해 한계가 밝혀졌으나, 특정 영역에서의 자동 증명은 비약적으로 발전했다. +- **Formal Verification (형식 검증)**: + - 운영체제 커널(seL4)이나 금융 스마트 컨트랙트처럼 단 하나의 버그도 허용되지 않는 곳에서, 프로그램이 사양(Specification)대로 동작함을 논리적으로 입증한다. +- **Lean & Coq (Proof Assistants)**: + - 최근 AI(LLM)와 결합하여 인간이 수학 문제를 풀 듯 증명 과정을 생성하고 검증하는 '대화형 증명 도우미'가 대세다. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- ATP는 엄청난 계산 자원을 소모하는 '탐색 문제'다. 모든 경로를 다 뒤지는 대신, 최근에는 신경망이 증명 전략(Tactics)을 제안하고 ATP가 이를 검증하는 하이브리드 방식이 각광받고 있다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Automated-Theorem-Proving.md]] ---- +- Related: [[Automated-Reasoning]] , [[Amazon-AWS-Formal-Verification]] +- Foundation: [[Computational Thinking]] diff --git a/AI/Autonomous Vehicle Path Planning.md b/AI/Autonomous Vehicle Path Planning.md deleted file mode 100644 index 061163c6..00000000 --- a/AI/Autonomous Vehicle Path Planning.md +++ /dev/null @@ -1,25 +0,0 @@ ---- -id: P-REINFORCE-AUTO-831796 -category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] -last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Autonomous Vehicle Path Planning" ---- - -# [[Autonomous Vehicle Path Planning]] - -## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... - -## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... - -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. - -## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Autonomous Vehicle Path Planning.md]] ---- diff --git a/AI/Autonomous-Vehicle-Path-Planning.md b/AI/Autonomous-Vehicle-Path-Planning.md index 630bae3f..e5373105 100644 --- a/AI/Autonomous-Vehicle-Path-Planning.md +++ b/AI/Autonomous-Vehicle-Path-Planning.md @@ -1,25 +1,27 @@ --- -id: P-REINFORCE-AUTO-405EC6 +id: P-REINFORCE-AI-PATHPLAN category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.98 +tags: [Path Planning, A* Algorithm, Robotics, Autonomous Vehicle] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Autonomous-Vehicle-Path-Planning" --- -# [[Autonomous-Vehicle-Path-Planning]] +# [[Autonomous-Vehicle-Path-Planning]] (자율주행 경로 계획) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> 경로 계획은 '가장 빠른 길'을 찾는 것이 아니라, '안전하고 부드러우며 예측 가능한' 움직임을 실시간으로 설계하는 확률적 탐색이다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Global Path Planning**: + - 출발지에서 목적지까지의 거시적인 경로를 설정한다. 고전적인 **A* (A-star)** 알고리즘이나 **Dijkstra** 알고리즘이 지도 데이터 위에서 작동한다. +- **Local Motion Planning (실시간 회피)**: + - 갑자기 튀어나오는 보행자나 장애물을 피하기 위한 미시적인 궤적 최적화. **RRT* (Rapidly-exploring Random Tree)**나 **Hybrid A*** 등이 사용된다. +- **Behavioral Decision (판단 레이어)**: + - 차선 변경, 추월, 일단 정지 등 도로의 법규(Traffic Laws)와 에티켓을 반영한 의사결정 알고리즘과 물리적 제어를 결합한다. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 과거에는 규칙 기반(Rule-based) 알고리즘이 주류였으나, 최근에는 복잡한 도심 상황을 해결하기 위해 'End-to-End' 딥러닝 방식과 '전통적 플래닝'을 결합한 계층적 구조가 표준으로 자리 잡았다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Autonomous-Vehicle-Path-Planning.md]] ---- +- Related: [[Systemic_Simulation_Principles]] , [[Robotic Manipulation]] +- Context: [[Digital Twins]] diff --git a/AI/Bayesian Inference.md b/AI/Bayesian Inference.md index 314b0ba3..d331f80a 100644 --- a/AI/Bayesian Inference.md +++ b/AI/Bayesian Inference.md @@ -1,25 +1,29 @@ --- -id: P-REINFORCE-AUTO-5875AD +id: P-REINFORCE-AI-BAYES category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.99 +tags: [Bayesian Inference, Probability, Thinking, Logic] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Bayesian Inference" --- -# [[Bayesian Inference]] +# [[Bayesian-Inference]] (베이지안 추론) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> 세상은 확실한 답변(P=0 or 1)이 아니라 '확률적 믿음'으로 가득 차 있으며, 새로운 증거가 나타날 때마다 그 믿음의 확률을 끊임없이 수정(Update)하는 것이 진정한 지능이다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Prior, Likelihood, Posterior**: + - **Prior (사전 확률)**: 사건이 발생하기 전의 나의 믿음. + - **Likelihood (우도)**: 만약 내 믿음이 맞다면 이번 결과가 나올 확률. + - **Posterior (사후 확률)**: 결과를 목격하고 난 뒤 수정된 새로운 믿음. +- **베이즈 정리 ($P(A|B) = P(B|A)P(A) / P(B)$)**: + - 관측되지 않은 원인(A)의 확률을 관측된 결과(B)를 통해 추론하는 강력한 수학적 도구. +- **Applications in AI**: + - 스팸 메일 분류(Naive Bayes), 자율주행 센서 퓨전(Kalman Filter), 강화학습의 탐험(Exploration vs Exploitation) 전략의 근간이다. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 전통 통계학(Frequentist)과의 차이점을 이해해야 한다. 베이지안은 '모르는 것'에 대한 주관적 가정을 허용하므로, 데이터가 적은 초기 단계에서 훨씬 강력하지만 부적절한 사전 확률(Prior) 설정은 편향된 결과를 낳을 수 있다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Bayesian Inference.md]] ---- +- Related: [[Information Theory]] , [[Common_Sense_Reasoning]] +- Foundation: [[Computational Thinking]] diff --git a/AI/Behavioral-Economics.md b/AI/Behavioral-Economics.md index dd16919c..79d13f98 100644 --- a/AI/Behavioral-Economics.md +++ b/AI/Behavioral-Economics.md @@ -1,25 +1,27 @@ --- -id: P-REINFORCE-AUTO-9A5386 +id: P-REINFORCE-AI-BEHAVE category: "[[10_Wiki/💡 Topics/AI]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.97 +tags: [Behavioral Economics, Human Factor, Nudge, Psychology] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - Behavioral-Economics" --- -# [[Behavioral-Economics]] +# [[Behavioral-Economics]] (행동 경제학) ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> 인간은 합리적이지 않다. 다만 '예측 가능하게 비합리적'일 뿐이다. 이 비합리성의 패턴을 이해하는 것이 최고의 사용자 경험(UX)을 만드는 열쇠다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **Loss Aversion (손실 회피)**: + - 10,000원을 얻었을 때의 기쁨보다 10,000원을 잃었을 때의 고통이 훨씬 크다. 이 기제로 인해 사람들은 변화를 거부하고 형상 유지(Status Quo Bias)를 선호한다. +- **Anchoring Effect (닻 내림 효과)**: + - 처음 제시된 정보(가격 등)가 기준점이 되어 이후 모든 판단에 영향을 준다. 할인 전 가격을 크게 써놓는 상술의 근거다. +- **Nudge (넛지)**: + - 명령이나 금지가 아니라, 선택 설계(Choice Architecture)를 통해 타인의 행동을 부드럽게 유도하는 기술 (예: 소변기의 파리 그림, 디폴트 옵션 설정). -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** AI 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 행동 경제학의 실험들은 최근 '재현성 위기'를 겪고 있다. 특정 실험실 환경에서의 결과가 실제 웹 환경이나 문화권마다 다르게 나타날 수 있음을 인지하고, 항상 자사 서비스에서의 자가 테스트(A/B Test)가 병행되어야 한다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/Behavioral-Economics.md]] ---- +- Related: [[Nudge Theory]] , [[A_B-Testing-Platforms]] +- Design: [[Design_Psychology]] diff --git a/Software Architecture/AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation.md b/Software Architecture/AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation.md index f4052fbe..61b33e82 100644 --- a/Software Architecture/AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation.md +++ b/Software Architecture/AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation.md @@ -1,25 +1,29 @@ --- id: P-REINFORCE-AUTO-4BB54E category: "[[10_Wiki/💡 Topics/Software Architecture]]" -confidence_score: 0.90 -tags: [auto-reinforced] +confidence_score: 0.98 +tags: [AlphaGo, MCTS, Reinforcement Learning, Simulation, Robotics] last_reinforced: 2026-04-20 -github_commit: "[P-Reinforce] Continuous Worker - AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation" +github_commit: "[P-Reinforce] Substantial content added to AI Simulation Bundle." --- -# [[AlphaGo (Monte Carlo Tree Search RL)] [Autonomous Driving Simulation] [Robotic Manipulation]] +# [[AlphaGo (Monte Carlo Tree Search + RL)], [Autonomous Driving Simulation], [Robotic Manipulation]] ## 📌 한 줄 통찰 (The Karpathy Summary) -> 지식 요약 정보 추출 중... +> 복잡한 의사결정 문제는 '모든 경우의 수'를 계산하는 것이 아니라, '승리(성공) 가능성이 높은 경로'를 시뮬레이션으로 탐색하고 그 경험을 신경망(RL)에 내재화하는 과정이다. ## 📖 구조화된 지식 (Synthesized Content) -본문 구조화 작업 중... +- **AlphaGo (MCTS + RL)의 정수**: + - **Monte Carlo Tree Search (MCTS)**: 무작위 시뮬레이션을 통해 유망한 수(Node)를 확장하고 통계적으로 최적의 수를 찾는다. + - **Reinforcement Learning (강화 학습)**: 자가 대국(Self-play)을 통해 정책망(Policy Network)과 가치망(Value Network)을 고도화하여, 인간의 기보를 뛰어넘는 직관을 형성한다. +- **자율주행 시뮬레이션 (Autonomous Driving Simulation)**: + - 현실에서의 사고는 치명적이다. 디지털 트윈 환경에서 수백만 마일의 가상 주행을 통해 코너 케이스(Edge Cases)를 학습시키고, 이를 현실 세계의 제어 알고리즘으로 이식(Sim-to-Real)한다. +- **로봇 조작 (Robotic Manipulation)**: + - 물체의 마찰력, 중력, 촉감을 물리 엔진 내에서 물리 법칙으로 구현하고, 강화 학습을 통해 로봇 팔이 정교한 동작을 수행하도록 훈련시킨다. -## ⚠️ 모순 및 업데이트 (Contradictions & RL Update) -- **과거 데이터와의 충돌:** 자동화 엔진에 의해 매핑된 지식으로, 추후 정밀 검증 필요. -- **정책 변화:** Software Architecture 분야의 자동 자산화 수행. +## ⚠️ 모순 및 업데이트 (RL Update) +- 시뮬레이션은 정교할수록 좋지만, 현실과의 괴리인 'Reality Gap'이 항상 존재한다. 이를 해결하기 위해 Domain Randomization(시뮬레이션 환경에 무작위 변동을 주어 강건함을 확보) 기법이 필수적으로 동반되어야 한다. ## 🔗 지식 연결 (Graph) - -- Raw Source: [[00_Raw/2026-04-20/AlphaGo (Monte Carlo Tree Search + RL)], [Autonomous Driving Simulation], [Robotic Manipulation.md]] ---- +- Related: [[Digital Twins]] , [[Reinforcement Learning]] , [[Systemic_Simulation_Principles]] +- Foundation: [[Information Theory]]