신뢰성 코어 (P1~P2):
- Requirement Graph: 업무 유형(회의록/시장조사/업무조사/일정) 필수 요소 주입 + 커버리지 hook
- Confidence Engine(0~100 결정론적) / Escalation Engine(검토 요청) / Epistemic Guard(모름·추정·확실 3분류)
- Provenance: citationTrace 에 출처 수정일·오래됨 경고
- Critic Loop: 문제 신호 turn 만 LLM 검수 1회 + 보완 카드
성장 루프 (P3):
- Gap Detector(Requirement-Knowledge) / Need Engine(30/25/20/15/10 공식) / Knowledge Inventory
- Learning Queue(proposed 전용 병합 — 승인은 사람만) / Decision Journal / Reflection 기록
- 반복 누락 요소(3회+)는 다음 turn 체크리스트에 자동 강조 (T5 루프)
지식 운영 (P4) + 기억 (P5) + 학습 실행 (P6):
- Knowledge Validation + Belief Revision(중복 reject·충돌 시 update/add 권고)
- Knowledge Decay(분야별 반감기 감사) / Knowledge Debt(blocked x impact)
- Organizational Memory(.astra/organization.md 상시 주입)
- Research Agent(approved 큐 -> 조사 브리프+추정 라벨 초안+Validation 게이트 -> proposals/)
- Skill Score(전/후반 추세) + Success Pattern DB(전요소충족+확신도90+ 자동 적재)
병렬 트랙:
- 캘린더 충돌 게이트: conflictCheck + 구조화 이벤트 캐시 + create_calendar_event 차단(force 는 사용자 승인 후)
- Task Eval Harness: 회의록 골든셋 자동 채점 명령 + 성장 리포트/학습 큐/노후 점검 명령
신규 모듈 17종(src/intelligence/), VS Code 명령 5종, 설정 11종, 테스트 +89건(전체 508 통과).
설계 문서: docs/SELF_EVOLVING_OS_MASTER_PLAN.md
Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
ASTRA Self-Evolving Digital Employee OS — 마스터 개발 계획 v1.1
작성일: 2026-06-11
기준 문서: "Self-Evolving Digital Employee OS v1.0" 설계서 (사용자·LLM 공동 설계)
재구성 원칙: 신뢰성 우선(Trust-First) — 전 모듈을 빠짐없이 개발하되, 순서는 신뢰 → 품질 → 성장 루프 → 운영 → 고급 학습 순으로 재배열
1. 비전과 목표
ASTRA를 사용자가 의존하고 신뢰할 수 있는 AI 디지털 직원으로 만든다.
주 업무: 회의록 작성, 일정 관리, 시장 조사, 업무 조사 (지속 확장 예정)
부 업무(minor): 블로그 글, 쇼츠/YouTube 스크립트, 이미지 프롬프트
기반 모델: Gemma 4 (로컬, LM Studio) — 모델 자체를 바꾸지 않고 주변 시스템으로 성능을 만든다
체감 품질 구성비: 모델 20% + 프롬프트 30% + RAG 30% + 평가 20%
신뢰의 5조건 (전 모듈의 존재 이유)
#
조건
담당 모듈
T1
모르면 모른다고 말한다
Anti-Hallucination Layer
T2
근거를 제시·역추적할 수 있다
Knowledge Provenance, Decision Journal
T3
품질이 일관적이다 (필수 요소 누락 없음)
Requirement Graph, Critic Agent
T4
확신이 없으면 사람에게 묻는다
Confidence Engine, Escalation Engine
T5
같은 실수를 반복하지 않는다
Failure Pattern DB, 성장 루프 4종
최종 상태
업무 수행 → 자기 평가 → 부족함 발견 → 학습 필요 정의 → 학습 → 검증 → 역량 향상 → 다음 업무
게이트 G1: 3-2, 3-3, 3-4, 3-5 (Gap→Need→SelfEval→Queue) 4개를 최소 구현 후 2주 실사용 검증. 루프가 실제로 돌면(부족 발견→학습 항목 생성→승인→반영) Phase 4 이후 진행. 흔들리면 보강 후 재검증. 이 게이트 전에는 Track 7(고급 학습)을 시작하지 않는다.
Track 4 — 지식 운영 (Phase 4)
ID
모듈
책임
완료 기준
4-1
Knowledge Validation [신규]
출처 신뢰도·최신성·적합성·중복·충돌 검증
저장 전 검증 통과 필수화
4-2
Belief Revision [확장: conflictBlock]
충돌 시 Add/Update/Retire 결정
충돌 지식 자동 분류 + 승인 흐름
4-3
Knowledge Decay [신규]
분야별 감쇠 (기본: AI 30일 / SEO 90일 / 트렌드 180일 — 업무 도메인 주기 재정의)
P1 잔여: Critic Agent(criticAgent.ts, 조건부 1-pass 검수 — 커버리지 누락 또는 확신도<70 인 turn 만 LLM 1회) + Reflection Engine(reflectionStore.ts, <brain>/.astra/growth/reflections.jsonl) — 2026-06-11
P3 (부분): Self Evaluation v1 — Task Eval Harness(taskEvalHarness.ts) + 명령 g1nation.eval.tasks(회의록 골든셋 자동 채점) + g1nation.growth.report(주별 확신도/누락률 추이 + 반복 실수 Top). Failure Pattern v1: 반복 누락 요소(3회+)가 Requirement Graph 블록에 자동 강조 — T5 루프 첫 닫힘
P3 완료 (핵심 4 모두 구현, 2026-06-11): Gap Detector(gapDetector.ts, 턴별 Requirement−Knowledge), Need Engine(needEngine.ts, 설계서 공식 30/25/20/15/10) + Knowledge Inventory v1(보유/부족/없음), Learning Queue(learningQueue.ts, proposed 전용 병합 — 승인은 사람만, Permission Based Learning 준수), Decision Journal v1(reflection 의 factors/usedSources 필드). 명령: g1nation.growth.learningQueue
G1 게이트 — 2주 실사용 검증 (현재 위치): 업무 turn 을 실제로 처리하며 ① Reflection 적재 ② 반복 누락 강조 발동 ③ Need 산출 ④ 큐 제안→승인 흐름이 실제로 도는지 확인. 통과 전 P6/P7(고급 학습) 착수 금지
다음 측정: VS Code 에서 Astra: 업무 평가 실행 1회 → 커버리지 baseline 확보 (성장세 그래프의 0점)
P4 (2026-06-11): Knowledge Validation + Belief Revision(knowledgeValidation.ts — 중복 reject·충돌 시 update/add 권고, 판정만 하고 저장은 승인 흐름; Research Agent P6 배선 대기), Knowledge Decay(knowledgeDecay.ts + 명령 g1nation.knowledge.decayAudit — 분야별 반감기 감사, 비침습·보고만), Knowledge Debt(needEngine 내 computeKnowledgeDebt — learning-needs 리포트에 통합). Knowledge Graph 는 계획대로 보류
P5 (부분, 2026-06-11): Organizational Memory(orgMemoryBlock.ts — <brain>/.astra/organization.md 상시 주입, 파일이 UI). User Memory 는 기존 LongTermMemory 가 담당(추가 개발 불요 판단), Episodic 활용은 기존 5-layer 검색이 커버
P6 (부분, 2026-06-11): Research Agent(researchAgent.ts + 명령 g1nation.research.runQueue — approved 큐 항목 → 조사 브리프(LLM) + 내부 지식 현황(두뇌 검색) + 추정 라벨 초안 + Validation 게이트 → proposals/.md, 상태 in-progress 자동 전환. 외부 근거 수집은 /research·/benchmark 안내 — Bridge 에 범용 검색 API 가 없어 의도적 사람-개입 지점). Skill Score(skillScore.ts — 확신도 50%+충족률 30%+비에스컬 20%, 전/후반 추세) + Success Pattern DB(전요소충족+확신도90+ 자동 적재) — 성장 리포트에 통합
P6 잔여: Growth Analytics 고도화(기간 비교 차트), 성공 패턴의 신규 turn 주입(모범 사례 few-shot)
P7: Curiosity / Predictive / Experiment Engine, Goal Success Metrics — G1 게이트 통과 + reflection 데이터 축적 후 (데이터 없이 만들면 빈 엔진)
병렬: 캘린더 통합 (2026-06-11): 일정 충돌 게이트 — conflictCheck.ts(구간/종일 겹침 감지) + 구조화 이벤트 캐시(calendar_cache.json, refresh 시 md 와 동시 생성) + <create_calendar_event> 액션에 차단 배선(충돌 시 생성 보류·사용자 확인 요청, force="true" 는 사용자 승인 후에만). 기보유: Google OAuth·이벤트 생성·ICS 캐시·Tasks API
콘텐츠 트랙 (minor): 지침서를 .agent/skills/ 에 등록(사용자 작업), Critic 재사용은 기구현