2.4 KiB
2.4 KiB
id, category, confidence_score, tags, last_reinforced
| id | category | confidence_score | tags | last_reinforced | ||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| QA-INT-TEST-001 | 10_Wiki/💡 Topics/AI | 1.0 |
|
2026-04-26 |
Integration Testing for AI (AI 통합 테스트)
📌 한 줄 통찰 (The Karpathy Summary)
"개별 부품의 완벽함에 안주하지 말고, 그들이 톱니바퀴처럼 맞물려 돌아가는 전체의 하모니를 검증하라" — 여러 소프트웨어 모듈과 AI 모델, 외부 데이터 소스 등이 유기적으로 연결되어 데이터 파이프라인과 비즈니스 로직이 올바르게 작동하는지 확인하는 품질 보증 프로세스.
📖 구조화된 지식 (Synthesized Content)
- 추출된 패턴: "Contract Testing" — 각 컴포넌트 간의 입출력 규약(Interface)이 준수되는지 확인하고, 특히 비결정론적인 AI 모델의 응답이 전체 시스템의 예외 처리 로직을 무너뜨리지 않는지 검증하는 흐름 보장 패턴.
- 주요 테스트 영역:
- Data Pipeline Integration: 수집된 Raw 데이터가 전처리 과정을 거쳐 위키 인덱스까지 무결하게 도달하는가?
- Agent-Tool Interaction: 에이전트가 외부 도구(Git, 파일 시스템 등)를 호출하고 그 결과를 올바르게 해석하는가?
- Model-UI Sync: AI의 실시간 스트리밍 응답이 프론트엔드 아키텍처 상에서 깨짐 없이 렌더링되는가?
- 도전 과제: AI 응답의 가변성으로 인해 전통적인 Assert 문 사용이 힘듦. -> 확률적 범위 검증(Probabilistic Testing)이나 골든셋(Golden Set) 비교 기법 활용.
⚠️ 모순 및 업데이트 (Contradictions & RL Update)
- 과거 데이터와의 충돌: 정적 코드를 검증하던 방식에서, 데이터의 변화와 모델의 확률적 특성까지 고려해야 하는 '동적 시스템 검증'으로 테스트의 난이도와 중요도가 급상승함.
- 정책 변화: Antigravity 프로젝트는 모든 커밋 전, 에이전트의 주요 시나리오(지식 생성, 파일 수정 등)를 시뮬레이션하는 통합 테스트 자동화 스크립트를 실행하여 시스템의 강건성을 유지함.
🔗 지식 연결 (Graph)
- DevOps-for-AI-MLOps, Software-[[Architecture-Patterns]], Input-Validation-Strategies, system-Design-for-AI-Scale
- Raw Source: 10_Wiki/Topics/AI/Integration-Testing-for-AI.md