a114d968b0
- Alignment Self-Learning: 자가 조사(질문 전 두뇌 검색)·사용자 답변 두뇌 저장·핵심메시지/프로젝트 컨텍스트 주입 (alignmentResearch.ts 신규)
- 웹 접근: Bridge 폴백 직접 fetch(webFetch.ts 신규)·<fetch_url> 액션 태그·기업 모드 URL/아키텍처 컨텍스트 주입·bare 도메인 인식
- 트리거 버그 수정: startsWith('/') 가 절대경로를 슬래시 명령으로 오인 — 분석 지시·URL 주입 전멸 원인 (회귀 테스트 고정)
- 자기지식 접지: 기능 인벤토리 lazy 재생성·학습 메커니즘 정본 섹션·[인벤토리 대조] 태그 의무화·결정론적 재구현 제안 정정 훅(featureConceptMap.ts 신규)
- 환경 자가점검: HealthCheckMonitor 에 Bridge/두뇌 볼륨/git 자격증명/확장 버전 검사 4종 + readyBar ⚠ 표시
- 두뇌 동기화: 원격 미설정 시 로컬 새로고침 모드·staged 기준 commit 판정·인증 부재 안내
- 기타: outputFormat 기본 markdown(제목 렌더 복구)·레슨/행동제약 truncation 보호 구역 이동·[CONTEXT] 절단 우선순위 재정렬
Co-Authored-By: Claude Fable 5 <noreply@anthropic.com>
10 KiB
10 KiB
Alignment Self-Learning 개선 계획 (v2 — 적대적 리뷰 반영)
v1 → v2 변경 (리뷰 지적 반영)
- [❌→해결] webview 렌더링: 2-C를 "권장"이 아닌 필수 구현으로 격상. 삽입 위치 media/sidebar.js 의 openQuestions 렌더 블록(~1228) 직후.
c.answeredQuestions중 자가 조사 marker 필터 후 최대 3건 표시. - [❌→해결] selfAnswerQuestions 시스템 프롬프트 전문 명시 (아래 2-A에 추가).
- [❌→해결]
companyAlignmentKnowledgeSavepackage.json 명세 추가 (3-C에 키 이름·기본값·설명 명시). - [⚠→해결] contract mutation → 비파괴적 변경:
analysis.contract를 직접 mutate하지 않고 spread로 새 객체 생성(enrichedContract). 이후 모든 경로(payload·_alignment.set·_runCompanyTurn)에 enriched를 전달. - [⚠→해결] 자가 조사 marker 명확화:
(자가 조사)→(자가 조사로 두뇌에서 확인)— dispatcher의 LLM이 사용자 직접 답변과 구분 가능하도록 의미를 텍스트에 내장. formatContractForPrompt 수정 불필요. - [⚠→확인완료] 파일 쓰기 권한: 기존 lessons.ts(line 64, 82)가 이미 fs.writeFileSync로 brain 폴더에 직접 쓰고 있음 — extension host는 로컬 fs 권한 제약 없음. 위험 아님.
- [⚠→영향없음] alignment 'off' 모드: 자가 조사는
_runIntentAlignment내부에서만 작동 — alignment 자체가 안 돌면 자가 조사도 비활성. 추가 처리 불필요.
목표
1인 기업 모드의 Intent Alignment(요청 분석) 단계가:
- 묻기 전에 프로젝트 컨텍스트를 먼저 본다 (Phase 1)
- 그래도 비는 항목은 두뇌를 스스로 검색해 답을 찾는다 (Phase 2)
- 정말 모르는 것만 사용자에게 묻고, 받은 답을 두뇌에 저장해 다음부터 안 묻는다 (Phase 3)
확인된 코드 사실
analyzeIntent입력(IntentAnalysisInput)에 프로젝트/두뇌 정보가 전혀 없음 — [intentAlignment.ts:51-74]_buildProjectArchitectureContext()가 이미 존재,.astra/project-context/architecture.md를 16,000자 cap으로 포맷 — [sidebarProvider.ts:1781, architecturePayloads.ts:97]- 분석기 모델은
companyIntentClassifierModel || defaultModel(작은 모델) — [sidebarProvider.ts:1942] - 두뇌 검색 빌딩블록:
findBrainFiles(utils, 5s cache) +getBrainTokenIndex+tokenize/expandQuery/scoreTfIdfPreTokenized+extractBestExcerpt— [retrieval/] RetrievalOrchestrator는MemoryManager의존이라 alignment에서 직접 쓰기 무거움 → 빌딩블록 직접 조합- webview alignment 카드는
openQuestions만 렌더,answeredQuestions는 미표시 — [media/sidebar.js:1209] - Lesson 시스템(kind: qa-finding)은 "실수 회피" 용도로 의미가 다름 → 일반 노트로 저장 (lesson frontmatter 사용 안 함)
analyzeIntent는 throw하지 않는 패턴 (실패 시 low-conf fallback) — 신규 코드도 동일 패턴 준수- alignment 흐름:
_runIntentAlignment→shouldAutoProceedAlignment판정 → auto-proceed 또는 카드 표시 →_handleAlignmentAnswer(답변 라운드) /_proceedWithCurrentAlignment(진행 버튼)
Phase 1 — 프로젝트 컨텍스트 주입
1-A. src/features/company/intentAlignment.ts
IntentAnalysisInput에projectContext?: string추가 (doc comment 포함)_buildUserMessage: projectContext 있으면 블록 추가:[프로젝트 컨텍스트 — 현재 워크스페이스에서 자동 수집] 아래는 현재 열려 있는 프로젝트의 아키텍처 요약입니다. 여기서 직접 확인되는 사실(프로젝트가 무엇인지·기술 스택·구조)은 이미 알려진 정보로 취급해 context 슬롯에 반영하고, openQuestions에 다시 넣지 마세요. --- <내용> ---SYSTEM_PROMPT에 규칙 1줄 추가: "[프로젝트 컨텍스트] 블록이 있으면 그 내용으로 context를 채우고, 거기서 답이 확인되는 질문은 openQuestions에 만들지 마세요."
1-B. src/sidebarProvider.ts _runIntentAlignment
- 첫 라운드만(
!opts.previousContract) — priorChatSummary와 동일 패턴:let projectContext: string | undefined; if (!opts.previousContract) { try { const arch = this._buildProjectArchitectureContext(); if (arch) { projectContext = arch.length > 3000 ? arch.slice(0, 3000) + '\n…(이하 생략 — 전체는 architecture.md 참조)' : arch; } } catch { /* alignment는 계속 */ } } analyzeIntent입력에projectContext전달- 주의: architecture detach(autoAttach=false) 사용자는 빈 문자열 → Phase 1 효과 없음 (의도된 동작)
Phase 2 — 자가 조사(Self-Research) 패스
2-A. 신규 src/features/company/alignmentResearch.ts
export const SELF_RESEARCH_PREFIX = '(자가 조사) ';
export interface QuestionEvidence {
question: string;
excerpts: Array<{ title: string; relativePath: string; excerpt: string }>;
}
// 두뇌 TF-IDF 검색 — 질문별 top 2 파일에서 발췌. 전체 합계 4,000자 cap.
// brainPath 없음/빈 두뇌/에러 → 빈 excerpts (throw 금지)
export function gatherEvidenceForQuestions(
brainPath: string,
questions: string[],
): QuestionEvidence[]
// LLM 1회 호출 — 근거만으로 답할 수 있는 질문 판별.
// JSON: { answers: [{ question, status: 'answered'|'unanswered', answer }] }
// 4-stage 관용 파서 (intentAlignment 패턴 복제). 실패 시 전원 unanswered.
export async function selfAnswerQuestions(
ai: IAIService,
input: { userPrompt: string; evidence: QuestionEvidence[]; model?: string },
): Promise<Array<{ question: string; answered: boolean; answer: string }>>
2-B. _runIntentAlignment 통합 (순서 변경 포함)
analyzeIntent 직후, shouldAutoProceedAlignment 판정 전에 삽입:
const contract = analysis.contract;
const reachedLimit = opts.roundsAsked >= opts.roundsLimit;
// ── 자가 조사: 사용자에게 묻기 전에 두뇌에서 스스로 답 찾기 ──
if (cfg.companyAlignmentSelfResearch !== false
&& contract.openQuestions.length > 0 && !reachedLimit) {
try {
const brain = getActiveBrainProfile();
const evidence = gatherEvidenceForQuestions(brain.localBrainPath, contract.openQuestions);
if (evidence.some((e) => e.excerpts.length > 0)) {
const answers = await selfAnswerQuestions(new AIService(), {
userPrompt: opts.userPrompt, evidence,
model: cfg.companyIntentClassifierModel || cfg.defaultModel,
});
const solved = answers.filter((a) => a.answered && a.answer.trim());
if (solved.length > 0) {
const solvedSet = new Set(solved.map((s) => s.question));
contract.answeredQuestions.push(
...solved.map((s) => ({ q: s.question, a: SELF_RESEARCH_PREFIX + s.answer })));
contract.openQuestions = contract.openQuestions.filter((q) => !solvedSet.has(q));
// pixelOffice 로그
}
}
} catch { /* 실패해도 원래 질문 그대로 진행 */ }
}
if (shouldAutoProceedAlignment(...)) { ... } // 기존 흐름 — openQuestions가 비면 자연히 confirm/진행
- 라운드 카운트 소비 없음 (사용자 응답이 아니므로)
- latency: 질문 있을 때만 LLM 1회 추가
2-C. webview media/sidebar.js (line ~1209 부근)
answeredQuestions중(자가 조사)prefix 항목이 있으면 카드에 소섹션 추가: "🔎 스스로 확인한 정보" + q/a 목록 (최대 3건, a는 150자 cap)
2-D. config
src/config.ts:companyAlignmentSelfResearch: boolean(default true) — 기존 company* 키 패턴package.json:g1nation.company.alignmentSelfResearchboolean default true + 설명
Phase 3 — 지식 요청 답변의 두뇌 저장 (학습 루프 완성)
3-A. alignmentResearch.ts에 추가
// 사용자가 직접 답한 Q/A만 (SELF_RESEARCH_PREFIX 제외, a.length >= 20)
// 저장: <brain>/Alignment Knowledge/YYYY-MM-DD <slug30>.md (일반 노트, frontmatter 없음)
// 동일 경로 존재 시 skip (중복 방지). 반환: 저장 경로 | null. throw 금지.
export function saveAlignmentKnowledge(
brainPath: string,
input: { userPrompt: string; qaList: Array<{ q: string; a: string }> },
): string | null
본문 형식:
# {userPrompt 앞 50자}
> 1인 기업 모드 Intent Alignment에서 사용자가 직접 제공한 정보. ({date})
## 원본 요청
{userPrompt}
## 확인된 정보
### Q. {q}
{a}
3-B. 트리거 2곳 (fire-and-forget)
_runIntentAlignment의 auto-proceed 분기:_runCompanyTurn직전_proceedWithCurrentAlignment:_runCompanyTurn직전- 조건:
cfg.companyAlignmentKnowledgeSave !== false&& 사용자 직접 답변 존재 - try/catch + void (alignment 흐름 차단 금지), pixelOffice 로그 "💾 확인된 정보 두뇌 저장"
3-C. config
companyAlignmentKnowledgeSave: booleandefault true + package.json 노출
효과 (루프 완성)
저장된 노트는 일반 brain 노트 → 다음 turn에서 Phase 2 자가 조사가 TF-IDF로 발견 → 같은 질문 재발 시 스스로 해결 → 사용자에게 두 번 묻지 않음.
구현 순서
- intentAlignment.ts (Phase 1-A) — 순수 추가
- alignmentResearch.ts 신규 (2-A + 3-A) — 독립 모듈
- config.ts + package.json (2-D + 3-C)
- sidebarProvider.ts 통합 (1-B + 2-B + 3-B)
- media/sidebar.js (2-C)
- tests/alignmentResearch.test.ts 신규 — 파서 관용성, marker 필터, slug 생성, 저장 skip, 빈 두뇌 안전성
npx tsc --noEmit+npm test
리스크 및 완화
| 리스크 | 완화 |
|---|---|
| 작은 모델 토큰 폭주 (arch 16K) | 3,000자 재절단 |
| 자가 조사 LLM이 엉뚱한 답을 "answered" 처리 | 프롬프트에 "근거에 명시된 것만, 불확실하면 unanswered" + 근거 출처 표기 |
| 두뇌 오염 (자동 저장) | 사용자 직접 답변만, 20자 미만 제외, 전용 폴더, config로 off 가능 |
| alignment latency 증가 | 질문 존재 시에만 작동, 검색은 캐시된 인덱스 |
| 기존 테스트 파손 | SYSTEM_PROMPT 변경은 순수 추가, 기존 입력 필드 시그니처 유지 |