feat(retrieval): 청크 검색 기본 켬(+62.5%p recall@1) + 확신도 전역화 (v2.2.218)

P1 — 섹션 청크 검색 기본 활성화: - 골든셋 24질의 A/B 측정: 파일 단위 → 섹션 청크에서 recall@1 12.5%→75.0% · recall@3 33.3%→83.3% · recall@5 37.5%→87.5% · MRR 0.217→0.802. 18질의 개선·악화 0건. - Phase 1-가 구현은 완성돼 있었으나 chunkLevelRetrieval 기본값이 false 라 실전 채팅이 열등한 파일 모드로 동작 — package.json·config 기본값 true 로. - tests/retrievalEvalCompare.test.ts: 환경변수(ASTRA_EVAL_BRAIN) 게이트형 A/B 회귀 측정 도구 (평소 skip — CI/패키징 무영향). P2 — 확신도 전역화 (/meet 원칙을 모든 대화로): - memoryContext 에 [GROUNDING] 블록 — 두뇌 근거 강도(강/보통/약)를 점수로 평가해 답변 정책 주입: 약함 → "⚠️ 두뇌 근거 약함" 표기+단정 금지, 강함 → 근거 문서 제목 인용, 보통 → 사실/추론 구분 서술. P3 — 회의 용어집 자동화 + 출력 위생: - /meet 실행마다 담당자 이름·사용자 메타데이터 용어를 .astra/meet_glossary.json 에 누적, 다음 실행 때 자동 주입 (STT 보정 용어집 — 반복 회의 표기 일관성). - selfIdentity 블록에 한·영 혼합 깨진 표기 금지 규칙 (전 대화, 무비용). Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
2026-06-11 18:13:11 +09:00
parent 92c92da090
commit c42c66a3fc
8 changed files with 174 additions and 7 deletions
@@ -30,6 +30,7 @@ import {
    transcriptHash, taskKey, loadRegisteredKeys, markRegistered,
    savePending, loadPending, clearPending, classifyAction,
    registerAction, buildNotes, parseConfirmArgs, renderPendingQuestion,
+    loadGlossaryTerms, updateGlossary, extractGlossaryCandidates,
    type PendingItem, type PendingFile,
 } from './scheduling/meetRegistration';
 import {
@@ -554,6 +555,15 @@ async function runMeet(arg: string, view: Webview | undefined, context?: vscode.
    }
    // 중복 방지 키 — 동일 녹취 재실행 시 이미 등록된 액션을 건너뛰기 위한 해시 (원본 전체 기준).
    const tHash = transcriptHash(transcript);
+    const userMetadata = metadata; // 용어집 후보 추출용 — 자동 보강 전 원본 보존
+    // [자동 용어집] 이전 /meet 들에서 누적된 인명·용어를 메타데이터에 보강 —
+    // meetPrompt 가 메타데이터를 STT 보정 용어집으로 쓰므로 반복 회의의 표기
+    // 일관성이 자동으로 좋아진다. 사용자 입력 메타데이터가 항상 우선(앞에 배치).
+    const glossaryTerms = loadGlossaryTerms();
+    if (glossaryTerms.length) {
+        metadata = `${metadata ? metadata + '\n' : ''}[자동 용어집 — 이전 회의에서 누적된 인명·용어 표기] ${glossaryTerms.join(', ')}`;
+        chunk(view, `📚 자동 용어집 ${glossaryTerms.length}개 용어 주입\n`);
+    }
    // v2.2.211: 60K 하드 자르기 폐지 → 세그먼트 추출(Map) + 병합(Reduce).
    // 단일샷 60K 는 로컬 32K 컨텍스트에서 잘리거나 lost-in-the-middle 로 중간
    // 안건이 증발하던 원인. 12K 조각별 추출은 입력이 짧아 누락·날조 둘 다 준다.
@@ -657,6 +667,11 @@ async function runMeet(arg: string, view: Webview | undefined, context?: vscode.
                chunk(view, `\nℹ️ 캘린더 자동 등록을 건너뜁니다 — Google Calendar OAuth(쓰기)가 연결되지 않았습니다. (Astra Settings → Google 섹션에서 연결)\n`);
            } else {
                const tasks = parseActionItems(report);
+                // [자동 용어집 누적] 이번 회의의 담당자 이름 + 사용자가 입력한 메타데이터
+                // 용어를 워크스페이스 용어집에 저장 — 다음 /meet 의 STT 보정에 자동 사용.
+                try {
+                    updateGlossary([...tasks.map(t => t.owner), ...extractGlossaryCandidates(userMetadata)]);
+                } catch { /* 용어집 실패는 본 흐름에 영향 없음 */ }
                if (tasks.length === 0) {
                    chunk(view, `\nℹ️ 액션 아이템이 없어 캘린더에 등록할 항목이 없습니다.\n`);
                } else {