--- id: hierarchy-of-evidence title: "Hierarchy of Evidence" category: "10_Wiki/Topics" status: "draft" verification_status: "conceptual" canonical_id: "" aliases: ["증거의 위계", "Validation Hierarchy"] duplicate_of: "" source_trust_level: "B" confidence_score: 0.85 created_at: 2026-06-12 updated_at: 2026-06-12 review_reason: "" merge_history: [] tags: ["research", "Assumption Validation Loop"] raw_sources: ["NotebookLM Synthesis"] applied_in: ["Dropbox: Demo Video Waitlist [1]", "Airbnb: Paying Guests [2]", "Buffer: Landing Page with Pricing [1]", "Zappos: Manual Fulfillment [2]"] github_commit: "" --- # [[Hierarchy of Evidence]] ## 🎯 한 줄 통찰 (One-line insight) 가설 검증의 신뢰도는 사용자의 단순한 긍정적 답변이 아니라, 사용자가 투입하는 **행동적 헌신(Commitment)의 강도**에 의해 결정된다 [3, 4]. ## 🧠 핵심 개념 (Core concepts) - **헌신 기반 검증 (Commitment-based Validation):** 검증의 핵심은 '무엇을 말하는가'가 아니라 '무엇을 거는가(Skin in the game)'에 있다 [4, 5]. - **의도-행동 격차 (Say-Do Gap):** 구매 의향에 대한 구두 답변은 실제 구매 행동을 약 60%가량 과대평가하는 경향이 있다 [4]. - **증거의 강도 (Evidence Strength):** 수집된 데이터의 유형에 따라 사업적 결정을 내릴 수 있는 확신의 수준이 달라진다 [3, 4]. ## 🧩 추출된 패턴 (Extracted patterns) - **점진적 투자 패턴:** 증거의 위계가 낮을 때는 적은 자원을 투입(랜딩 페이지 등)하고, 위계가 높아짐에 따라 투자를 확대하는 전략을 취한다 [4]. - **행동 데이터 우선 주의:** 의견(Opinion)이나 설문(Survey)보다 행동(Action) 데이터(클릭, 가입, 결제)를 상위 증거로 간주한다 [6-8]. - **실패 지점의 명확화:** 위계가 높은 실험일수록 가설이 틀렸음을 입증하는 '킬 크라이테리어(Kill Criteria)'를 설정하기가 더 용이하다 [9, 10]. ## 📖 세부 내용 (Details) 증거의 위계는 수집된 검증 데이터의 신뢰 수준을 4단계로 구분한다 [3]. 1. **언어적 확인 (Verbal Confirmation) - 가장 낮음(Weak):** - "그 제품이 나오면 사용할 것 같아요"와 같은 구두상의 칭찬이나 긍정적 피드백이다 [3]. - 사람들은 예의를 지키기 위해 거짓말을 하는 경향이 있으므로, 비즈니스를 걸기에는 매우 위험한 신호다 [4, 9]. 2. **평판 헌신 (Reputation Commitment) - 보통(Moderate):** - 사용자가 자신의 동료를 소개하거나, 공개적으로 해당 솔루션을 지지하는 등 자신의 사회적 평판을 거는 행위이다 [3]. - 단순한 말보다 한 단계 더 나아간 의지를 보여준다 [3]. 3. **시간 헌신 (Time Commitment) - 높음(Strong):** - 제품 대기 명단(Waitlist)에 가입하거나, 상세 데모 세션에 참석하거나, 베타 테스팅에 시간을 할애하는 경우이다 [3]. - 사용자가 자신의 유한한 자원인 '시간'을 투입한다는 점에서 강한 수요 신호로 간주된다 [3, 4]. 4. **재무적 헌신 (Financial Commitment) - 가장 높음(Strongest):** - 사전 주문, 보증금 지불, 또는 구속력 있는 의향서(LOI) 서명이 이에 해당한다 [3, 4]. - 실제 현금이 오가는 시점에서 비즈니스 모델의 수익성이 실질적으로 검증된다 [4, 11]. **검증의 유효성 판단 기준:** - **저충실도(Low-Fi) MVP:** 주로 수요(Demand)와 언어적 확인을 검증하는 데 적합하다 [6, 12]. - **고충실도(High-Fi) MVP:** 실제 사용자 행동과 재무적 헌신을 이끌어내어 가치(Value)와 사용성(Usability)을 심층적으로 검증한다 [6, 13]. ## ⚖️ 모순 및 업데이트 (Contradictions & updates) - **검증 연극 (Validation Theater):** 단순히 질문을 하고 긍정적인 답을 얻는 행위는 실제 검증이 아니라 안심하기 위한 '의식'에 불과하며, 위계상 최하위 증거에 머문다 [14, 15]. - **AI 도구의 양면성:** AI를 활용해 더 빠르게 무언가를 만들 수 있게 되었으나, 이는 '실제 수요'와 상관없는 '잘못된 제품'을 만드는 속도 또한 가속화하므로 증거 위계에 따른 엄격한 검증이 더욱 중요해졌다 [16]. ## 🛠️ 적용 사례 (Applied in summary) - **Dropbox:** 실제 코드를 짜기 전, 동작 원리를 설명하는 데모 비디오를 공개하여 75,000명의 대기 명단(시간 헌신)을 확보함으로써 수요를 검증했다 [1, 16]. - **Airbnb:** 디자인 컨퍼런스 기간 중 자신의 아파트에 에어매트리스를 놓고 실제 3명의 유료 투숙객(재무적 헌신)을 받아 비즈니스 모델의 생존 가능성을 입증했다 [2, 17, 18]. - **Buffer:** 랜딩 페이지에서 가격 책정 페이지를 클릭하는 행동을 추적하여, 사용자가 단순히 관심이 있는 것인지 실제로 지불 의사(재무적 헌신 의도)가 있는지를 구분하여 검증했다 [1, 19, 20]. - **Zappos:** 재고를 확보하기 전, 인근 신발 가게의 사진을 찍어 웹사이트에 올리고 주문이 들어오면 직접 가서 사서 배송하는 방식(재무적 헌신 수집)으로 온라인 신발 구매 수요를 확인했다 [2, 21, 22]. ## ✅ 검증 상태 및 신뢰도 - **상태:** draft - **검증 단계:** conceptual (실제 적용 사례 발견 시 applied/validated로 승격 가능) - **출처 신뢰도:** B (Official Documentation / Primary Source via NotebookLM) - **중복 검사 결과:** 신규 생성 (New discovery) ## 📝 변경 이력 (Change history) - 2026-06-12: Initial draft generated via Datacollector_MAC P-Reinforce engine.