diff --git a/10_Wiki/Topics/AI_and_ML/ASTRA 자기 아키텍처.md b/10_Wiki/Topics/AI_and_ML/ASTRA 자기 아키텍처.md index 0310f032..e7fa2edd 100644 --- a/10_Wiki/Topics/AI_and_ML/ASTRA 자기 아키텍처.md +++ b/10_Wiki/Topics/AI_and_ML/ASTRA 자기 아키텍처.md @@ -5,7 +5,7 @@ category: "AI_and_ML" status: "verified" verification_status: "applied" canonical_id: "self" -aliases: ["ASTRA", "아스트라", "Astra Self-Architecture", "ASTRA 기능", "ASTRA 능력", "ASTRA 성장", "자아 성찰적 학습", "Self-Reflective Learning", "Self-Evolving OS", "아스트라 정체성", "ASTRA가 할 수 있는 것"] +aliases: ["ASTRA", "아스트라", "Astra Self-Architecture", "ASTRA 기능", "ASTRA 능력", "ASTRA 성장", "자아 성찰적 학습", "Self-Reflective Learning", "Self-Evolving OS", "아스트라 정체성", "ASTRA가 할 수 있는 것", "Correction Loop", "정정 루프", "약점 프로필"] duplicate_of: "" source_trust_level: "S" confidence_score: 1.0 @@ -28,7 +28,9 @@ ASTRA는 가중치가 고정된 일반 LLM이 아니라, 두뇌(Second Brain)· - **두뇌(Second Brain)**: 두뇌 폴더의 위키 문서 전체. 리서치(`/research`)·위키화(`/wikify`)·회의록(`/meet`) 등이 문서를 생성·축적하고, 매 대화에서 검색(RAG: TF-IDF+임베딩)으로 주입된다. - **기억 시스템**: 장기 기억 `memory/long_term.json`(대화에서 추출된 사실) · 일화 기억 `memory/episodes/*.json` · 프로젝트 기억 `.astra/project_memory.json` — 다음 세션에 자동 재사용. - **레슨(경험 기억)**: `lessons/` — 작업 경험에서 만들어진 교훈. 수동 생성(Astra: New Lesson) 또는 대화에서 생성되어 이후 판단에 반영. -- **Self-Evolving OS (자아 성찰적 학습 루프)**: ① 골든셋 기반 평가(검색 recall@k/MRR, 회의록 업무 평가) ② 성장 리포트(Reflection 추이) ③ 학습 큐 갱신(Need Engine — 부족한 지식 식별) ④ 지식 노후 점검(Knowledge Decay) ⑤ 승인된 학습 큐의 자동 실행(Research Agent). 측정 → 부족 식별 → 학습 실행 → 재측정의 폐루프. +- **Self-Evolving OS (자아 성찰적 학습 루프)**: ① 골든셋 기반 평가(검색 recall@k/MRR, 회의록 업무 평가) ② 성장 리포트(Reflection 추이) ③ 학습 큐 갱신(Need Engine — 부족한 지식 식별) ④ 지식 노후 점검(Knowledge Decay) ⑤ 승인된 학습 큐의 자동 실행(Research Agent). 측정 → 부족 식별 → 학습 실행 → 재측정의 폐루프. 매주 일요일 20:00 자동 실행(주간 성장 사이클). +- **Correction Loop (정정 루프, v2.2.223)**: 사용자의 정정("아니야, ~가 아니라") 한 번이 세 곳을 동시에 성장시킨다 — ① 오류 유형 자동 분류(사실오류/근거누락/맥락누락/추론오류/지시불이행/형식오류) 후 태깅 레슨 저장 + 회귀 케이스 적립(`.astra/eval/corrections.jsonl`, 정정 자체가 Ground Truth) ② 주간 사이클이 정정받은 질문을 재검사해 "같은 실수 반복?" 판정(`regression-report.md`) + 약점 프로필 갱신(`weakness-profile.json`) ③ 반복 약점(2회+)은 다음 턴부터 [자기검토] 블록으로 프롬프트에 주입 — 통계가 행동을 바꾼다. +- **Awareness Gap 관리 ([[Awareness Gap (인지 공백)]])**: "모르면서 안다고 착각"을 구조적으로 차단 — [GROUNDING] 블록이 매 질의의 두뇌 근거 강도를 측정하고, 약하면 "⚠️ 근거 약함" 표명 강제 + scope 완화 재검색 + 지식 공백을 학습 큐에 자동 proposed 등록(승인은 사람). 환각방지·확신도·에스컬레이션의 공통 뿌리. ## 🧩 추출된 패턴 (Extracted patterns) - **성장의 실체는 디스크에 있다**: 두뇌 위키 문서 수천 개, lessons/, memory/, .astra/eval(골든셋)·growth(리포트) — 전부 실재 파일이며 git(NAS)으로 백업된다. @@ -60,8 +62,9 @@ ASTRA는 가중치가 고정된 일반 LLM이 아니라, 두뇌(Second Brain)· ## 🔗 지식 그래프 (Knowledge Graph) - **상위/루트:** [[AI_and_ML]] -- **관련 개념:** [[RAG 파이프라인]], [[임베딩 (Embedding)]], [[P-Reinforce]], [[Datacollect Architecture]] +- **관련 개념:** [[RAG 파이프라인]], [[임베딩 (Embedding)]], [[P-Reinforce]], [[Datacollect Architecture]], [[Awareness Gap (인지 공백)]] - **참조 맥락:** ASTRA가 자기 기능·성장 방식·정체성에 대한 질문을 받을 때 1순위 근거. ## 📝 변경 이력 (Change history) - 2026-06-11: 최초 작성 — 자기 오보고 버그(일반 LLM 보일러플레이트 답변) 수정의 일환으로, RAG가 검색 가능한 정본 자기 기술서 생성. +- 2026-06-12: Correction Loop(v2.2.223)·Awareness Gap 관리 추가, 임베딩 하이브리드 검색 기본 활성화(v2.2.222) 반영. diff --git a/10_Wiki/Topics/AI_and_ML/Awareness Gap (인지 공백).md b/10_Wiki/Topics/AI_and_ML/Awareness Gap (인지 공백).md new file mode 100644 index 00000000..247b2c86 --- /dev/null +++ b/10_Wiki/Topics/AI_and_ML/Awareness Gap (인지 공백).md @@ -0,0 +1,61 @@ +--- +id: awareness-gap +title: "Awareness Gap (인지 공백)" +category: "AI_and_ML" +status: "verified" +verification_status: "applied" +canonical_id: "awareness-gap" +aliases: ["Awareness Gap", "인지 공백", "지식 공백", "Self-Awareness of Gap", "Knowledge Gap", "unknown unknowns", "모른다는 것을 모름"] +duplicate_of: "" +source_trust_level: "A" +confidence_score: 0.95 +created_at: 2026-06-12 +updated_at: 2026-06-12 +tags: ["epistemology", "hallucination", "reliability", "self-evolving", "ASTRA"] +raw_sources: ["인식론 일반 (unknown unknowns)", "Dunning & Kruger (1999)", "E:\\Wiki\\connectai 소스 코드 (GROUNDING/Correction Loop 구현)"] +applied_in: ["connectai/src/lib/contextBuilders/memoryContext.ts (GROUNDING 측정·학습큐 등록)", "connectai/src/intelligence/correctionLoop.ts"] +github_commit: "" +--- + +# [[Awareness Gap (인지 공백)]] + +## 🎯 한 줄 통찰 (One-line insight) +Awareness gap은 **"실제로 모르는 것"과 "모른다고 인지하는 것" 사이의 간극**이다. 위험한 것은 모름 자체가 아니라 모르면서 안다고 착각하는 상태이며, AI 시스템의 환각(hallucination)은 이 갭의 기계적 발현이다. + +## 🧠 핵심 개념 (Core concepts) +- **Unknown unknowns**: 모른다는 사실조차 모르는 영역. 인지하면(known unknown) 질문하거나 조사하면 되지만, 인지하지 못하면 그럴듯한 추측이 사실로 둔갑한다. +- **더닝-크루거 효과**: 능력이 낮을수록 자신의 부족함을 인지하지 못하는 심리학적 현상 — 사람에게 나타나는 awareness gap의 한 단면. +- **LLM에서의 구조적 원인**: LLM은 "다음에 올 가장 그럴듯한 말"을 생성하므로 **근거가 없을 때도 유창하고 확신에 찬 문장이 나온다**. 확신도와 정확도가 분리되어 있어, 모델 스스로는 갭을 감지할 신호가 없다. +- **시스템적 해법**: 모델이 못 하므로 시스템이 바깥에서 ① 근거를 측정하고 ② 약하면 "모름/추정"을 강제 표명시키고 ③ 공백을 기록해 나중에 채운다. + +## 🧩 추출된 패턴 (Extracted patterns) +- **측정 → 고백 → 기록 → 해소**: awareness gap 관리의 4단계. 측정 없는 고백은 불가능하고, 기록 없는 해소는 일회성이다. +- **갭 관리 = 신뢰성의 핵심**: 환각방지·출처표기·확신도·에스컬레이션은 전부 같은 문제(이 갭)를 다른 각도에서 공략하는 것. + +## 📖 세부 내용 (Details) +### ASTRA에서의 구현 (이 개념이 실제로 동작하는 곳) +| 단계 | 메커니즘 | 위치 | +|---|---|---| +| 측정 | [GROUNDING] 블록 — 매 질의의 두뇌 근거 강도(강함/보통/약함)를 검색 점수로 판정 | memoryContext | +| 고백 | 약함이면 답변 첫 줄 "⚠️ 두뇌 근거 약함 — 추정입니다" 표기 강제 + 단정 금지 | GROUNDING 정책 | +| 구제 | 약함 + agent scope 적용 중이면 전체 두뇌로 1회 재검색 (scope가 정답을 가리는 경우) | Correction Loop ③-a | +| 기록 | 그래도 약하면 학습 큐에 지식 공백 자동 proposed 등록 (`.astra/growth/learning-queue.json`) | Correction Loop ③-b | +| 해소 | 사람이 approved로 승인 → 주간 성장 사이클의 Research Agent가 학습 실행해 두뇌 보강 | growthCycle | + +### 관련 갭: 능력의 자기 인지 +지식만이 아니라 **자기 실수 패턴의 인지**도 같은 구조다. ASTRA의 Correction Loop는 사용자 정정을 오류 유형별로 태깅해 약점 프로필(`weakness-profile.json`)을 만들고, 반복 약점을 [자기검토] 블록으로 주입한다 — "내가 어떤 실수를 자주 하는지 모르는 갭"의 해소. + +## ⚖️ 모순 및 업데이트 (Contradictions & updates) +- "확신 있는 답 = 좋은 답"이라는 직관은 LLM에서 성립하지 않는다 — 확신도와 정확도가 분리되어 있으므로, 근거 표기가 없는 확신은 오히려 경계 신호다. + +## ✅ 검증 상태 및 신뢰도 +- **상태:** verified · **검증 단계:** applied (ASTRA 구현 코드가 동작 증거) +- **출처 신뢰도:** A · **신뢰 점수:** 0.95 + +## 🔗 지식 그래프 (Knowledge Graph) +- **상위/루트:** [[AI_and_ML]] +- **관련 개념:** [[ASTRA 자기 아키텍처]], [[Introspection (자기성찰)]], [[Cognitive Biases]], [[RAG 아키텍처 및 파이프라인 기초]] +- **참조 맥락:** ASTRA가 환각방지·확신도·자기 한계에 대한 질문을 받을 때, 또는 "왜 모른다고 답했어?"라는 질문의 근거. + +## 📝 변경 이력 (Change history) +- 2026-06-12: 최초 작성 — Correction Loop(v2.2.223) 구현과 함께 개념을 두뇌에 정착.