feat: Wiki 지식 자산 업데이트 - UX Scenarios, Frontend, Game Design, Topics 추가 [2026-05-08]

This commit is contained in:
2026-05-08 19:52:07 +09:00
parent 9dd3d40662
commit 5ba5a55c78
3984 changed files with 334557 additions and 28839 deletions
@@ -1,22 +1,38 @@
---
id: wiki-2026-0508-v-component-evaluation-interface
title: V component (Evaluation Interface)
category: 10_Wiki/Topics
status: needs_review
canonical_id: self
aliases: []
duplicate_of: none
source_trust_level: A
confidence_score: 0.92
tags: [uncategorized]
raw_sources: []
last_reinforced: 2026-05-08
github_commit: pending
inferred_by: Claude Opus 4.7 (auto-normalize 2026-05-08)
---
# [[V-component (Evaluation Interface)|V-component (Evaluation Interface)]]
## 📌 Brief Summary
## 📌 한 줄 통찰 (The Karpathy Summary)
V-component(Evaluation Interface)는 에이전트 하네스의 '눈'에 해당하는 구성 요소로, 에이전트의 출력물이나 도구 실행 결과를 객관적으로 평가하고 피드백을 생성하는 책임을 진다. 작업이 성공적으로 완료되었는지, 결과물이 제약 사항을 준수했는지, 혹은 오류가 발생했는지를 판단하여 실행 루프(E-component)에 다음 행동을 결정할 근거를 제공한다.
## 📖 Core Content
## 📖 구조화된 지식 (Synthesized Content)
* **결과 검증 (Output Verification)**: 모델이 생성한 코드, 문서, 데이터 형식이 사전에 정의된 스펙(Schema, Linter, Test Case)에 부합하는지 자동 검사한다.
* **자기 비판 (Self-Correction Feedback)**: 검증 실패 시 단순히 "에러 발생"이라고 알리는 대신, 무엇이 틀렸고 어떻게 고쳐야 하는지에 대한 구체적인 피드백 프롬프트를 생성하여 에이전트에게 전달한다.
* **벤치마킹 및 채점 (Scoring)**: 작업의 품질을 정량화된 점수로 환산하여, 여러 번의 시도 중 가장 우수한 결과물을 선택하거나 에이전트의 성능 추이를 모니터링한다.
* **환각 탐지 (Hallucination Detection)**: 에이전트의 답변이 실제 근거(Evidence Memory)와 일치하는지, 혹은 논리적 모순이 없는지 검토한다.
* **인간 피드백 통합 (HITL Evaluation)**: 자동화된 평가가 어려운 경우 인간 사용자의 승인이나 점수를 입력받아 평가 프로세스에 반영한다.
## Trade-offs & Caveats
## 모순 및 업데이트 (Contradictions & Updates)
* **평가자 모델의 한계**: 평가를 위해 또 다른 LLM을 사용할 경우, 평가자 자체가 환각을 일으키거나 편향된 판단을 내릴 리스크가 있다.
* **검증 오버헤드**: 모든 단계에서 엄격한 검증을 수행하면 전체 작업 시간이 길어지고 비용이 증가한다.
* **평가 기준의 모호성**: 주관적인 디자인이나 문구 작성 등의 작업에 대해서는 객관적인 평가 지표를 설정하기 어렵다.
## 🔗 Knowledge Connections
## 🔗 지식 연결 (Graph)
### Related Concepts
* [[Agent Harness|Agent Harness]]
* 연결 이유: V-component는 하네스의 품질 보증 계층이다.
@@ -36,3 +52,29 @@ V-component(Evaluation Interface)는 에이전트 하네스의 '눈'에 해당
---
*Last updated: 2026-05-01*
## 🤖 LLM 활용 힌트 (How to Use This Knowledge)
**언제 이 지식을 쓰는가:**
- *(TODO)*
**언제 쓰면 안 되는가:**
- *(TODO)*
## 🧪 검증 상태 (Validation)
- **정보 상태:** needs_review
- **출처 신뢰도:** A
- **검토 이유:** *(P-Reinforce Phase 1 자동 정규화. 본문 검증 필요.)*
## 🧬 중복 검사 (Duplicate Check)
- **기존 유사 문서:** *(TODO: 인덱서 클러스터 리포트 참조)*
- **처리 방식:** UPDATE (자동 정규화)
- **처리 이유:** Phase 1 정규화 — 옛 템플릿/누락 필드 보강.
## 🕓 변경 이력 (Changelog)
| 날짜 | 변경 내용 | 처리 방식 | 신뢰도 |
|------|-----------|-----------|--------|
| 2026-05-08 | P-Reinforce Phase 1 정규화 (frontmatter + 헤더 표준화) | UPDATE | A |