Files
2nd/10_Wiki/Topics/_Archive_Orphans/Knowledge-Extraction-Protocol.md
T

1.7 KiB

📑 지식 자산 증분 추출 프로토콜 (Incremental Extraction Protocol)

1. 개요 (Overview)

본 문서는 Connect AI 시스템의 'Thinking Mode'에서 표시되는 지식 자산을 로컬 위키 시스템으로 안전하게 이식하고, 향후 중복 없이 새로운 데이터만 필터링하여 가져오기 위한 운영 표준을 정의한다.

2. 데이터 베이스라인 (Baseline)

  • 추출 일시: 2026-04-29
  • 추출 수량: 1,535개 (Knowledge Assets)
  • 추출 로직: E:\Wiki\2nd\10_Wiki\Topics 내 마크다운 파일 중 알파벳 순 상위 1,535개 선별
  • 인벤토리: knowledge_inventory_1535.json

3. 필터링 규칙 (Filtering Rules)

향후 재추출 요청 시 다음의 로직을 적용한다:

  1. 경로 대조: knowledge_inventory_1535.json에 명시된 RelativePath와 동일한 파일은 무시한다.
  2. 신규성 판정: 기존 인벤토리에 존재하지 않는 새로운 파일명이 발견되거나, 동일 파일명이라도 수정 일시(LastWriteTime)가 최신인 경우만 '신규 지식'으로 간주한다.
  3. 8대 카테고리 유지: 추출 시 원본의 8대 분류 체계를 유지하며 00_Raw 폴더로 이식한다.

4. 실행 가이드 (Execution Guide)

  • 명령어: python E:\Wiki\Wonseok_AI_original\scratch\incremental_sync.py (차기 구현 예정)
  • 주의 사항: 원본 Topics 폴더의 파일 개수가 1,535개를 초과하여 증가하더라도, 인벤토리에 기록된 파일들은 중복으로 가져오지 않도록 엄격히 제한한다.

🫡 "지식은 축적될 때 비로소 힘을 발휘한다." - AI 개발부장 코다리 승인 🚩🐟